来了!科大讯飞发布星火认知大模型

科技工作者之家 2023-05-07

作者:赵广立 来源:中国科学报

5月6日,讯飞星火认知大模型成果发布会在安徽合肥举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型七大核心能力,并发布教育、办公、汽车、数字员工四大行业应用成果。会上,刘庆峰表示,当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上超越ChatGPT,并有信心将在10月底整体赶超ChatGPT。

“俗话说大丈夫宁死不屈,但是又说大丈夫要能屈能伸,请问这两句话怎么理解?”“如果一个小伙子跟女朋友吵架了,他应该宁死不屈还是能屈能伸呢?”现场演示中,星火大模型很好地理解了特定的句子和场景含义,随着问题的变化,灵活调整自己的答案。

刘庆峰表示,在写文案、编故事、写邮件等长文本生成上,讯飞星火大模型在国内领先,并且在中文方面超过了ChatGPT,并且在持续进步中。

讯飞星火也展示了其在常规计算、几何、情景应用等中的数学能力,在解答对应数学题目时,星火大模型同时给出解题步骤和答案。刘庆峰表示,数理能力一定程度代表了一个大模型的聪明程度,讯飞星火大模型的数理能力也超过了ChatGPT。

现场刘聪还展示了星火大模型能够对生活常识、科学知识、工作技巧,以及医学知识等应对自如,并表示其知识问答能力也已超过ChatGPT。

根据升级计划,刘庆峰透露,6月9日,讯飞星火大模型将突破开放式问答、提升多轮对话能力、再升级数学能力;8月15日,升级代码能力以及提升多模态交互能力;10月24日,将实现通用模型对标ChatGPT,希望实现中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。

后续,科大讯飞还将联合开发者推动大模型应用落地,共建人工智能“星火”生态。刘庆峰强调,“要看一个大模型系统到底好不好,首先要看它是不是能解决刚需、是不是真的有用,而不是一个简单的单点测试。”

刘庆峰透露,早在2022年12月15日,科大讯飞正式启动“1+N”认知大模型专项攻关,其中“1”就是指通用认知智能大模型,“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。他表示,虽然目前大模型技术还有待攻克的缺陷,比如新知识难以及时更新、事实类问答容易“张冠李戴”,史实、传统典籍等容易“编造情节”等,但这些问题在今年会有明显的改进。

“我们要向OpenAI致敬和学习,同时也要快速追赶并努力超越,而这需要一套科学系统的评测体系。”刘庆峰说,科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型,致力于在科学的评测体系中,推动大模型的发展。