科大讯飞解锁常识推理新成就

科技工作者之家 2022-04-16

4月12日,由科大讯飞承建的我国首个认知智能国家重点实验室,以76.06%的成绩登顶常识推理挑战赛(CSQA)2.0,刷新世界纪录。

从做“选择题”到做“判断题”

常识推理是自然语言处理(NLP)最重要的前进方向之一,其目的是帮助计算机学习常识知识,并利用所掌握的知识进行深层次的理解及推理。该领域的进展及技术突破对人工智能发展具有重要的意义。

当前典型的阅读理解模型所关注的问题类型主要是事实类问题,这类型的问题答案往往能直接在原文中找到,然而如何基于常识和背景知识进行推理以获得答案仍旧是个巨大的挑战。

CSQA是艾伦人工智能研究院于2021年主导发布的国际常识推理评测数据集,旨在评估机器对常识知识的理解及掌握水平,吸引了包括谷歌、华盛顿大学等众多国际顶尖机构参与挑战。该挑战赛正是为了训练机器像人类一样,基于先验知识结合现实情况作答能力而设置的数据集。当人们回答问题时,往往会利用自身了解的知识结合特定的背景来判断问题答案。比如常识、背景知识、空间关系、科学事实、社会惯例等。

例如:“我可以站在河上的什么地方看水流而不会弄湿自己?”人类可以很轻松地从选择项中推断是“在桥上”,但是如何让机器学会常识及背景知识并进行准确推理,仍然是一个巨大的挑战。

目前中国人工智能力量在常识推理领域中已有很大的进步,但是仍远低于人类94.1%的水平,可见在常识性推理方向仍有很大挑战和进步空间。

ACROSS模型破解难题

在CSQA 2.0的常识推理评测任务上,业界主流的中等大小预训练模型方法只能取得55%的水平,略高于随机猜测平均水平。此前国际上该任务的最优方法曾取得73%的准确率。

认知智能国家重点实验室团队提出的面向常识知识推理的ACROSS模型,实现了统一语义空间下外部知识的有效融合,显著改进了超大规模预训练模型所存在的问题,在CSQA 2.0任务上取得76%的准确率,刷新了机器常识推理水平世界纪录,在让机器“能理解、会思考”上迈出一大步。

该评测的常识推理问题,不论在ConceptNet等知识库,或者互联网上,都较难找到直接答案。从人类进行常识知识运用及推理的习惯出发,对于一个复杂的问题,首先需要查阅相关知识库或典籍,其次会借助互联网搜索去查找相关信息。

ACROSS模型正是借鉴该思路,充分收集知识库、互联网相关信息,在统一的语义空间中进行融合处理,最后赋予超大规模预训练模型更强的知识输入,实现准确的常识知识推理。该方法结果也一定程度上证明了机器已初步具备对于各类复杂文本信息及知识的深入理解及运用能力。

  版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
内容来源:科学网

来源:科学网

原文链接:http://news.sciencenet.cn/htmlnews/2022/4/477269.shtm

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

模型 问题 常识 常识推理

推荐资讯