同样是人工智能,说中文比说英文难在哪?

科技工作者之家 2016-12-26

  光明网讯(记者宋雅娟)“中文处理与英文有诸多差异,但是其最核心的区别在于中文重义合,英文重形合。”12月23日在中国科技会堂举行的中国中文信息学会第八次全国会员代表大会暨学会成立35周年学术会议上,中国中文信息学会理事长、哈尔滨工业大学的教授李生发布《2016年中文信息处理发展报告》时说道,“这种差异导致机器处理许多语法层面的任务时,中文比英文要更困难一些。”

  同样是人工智能,说中文比说英文难在哪?

  人工智能正进入人类生活的方方面面。Siri、阿尔法狗、智能机器人等人机交互系统愈来愈“善解人意”,偶尔,还能跟人类开开小玩笑。但善解人意的前提是语言,中文信息处理就是要利用计算机对汉语的音、形、义等语言文字信息进行的加工和操作,包括对字、词、短语、句、篇章的输入、输出、识别、转换、压缩、存储、检索、分析、理解和生成等各方面进行处理,“要让机器像人一样理解和生成中文,让中国人可以用自己的语言和机器进行交流”。

  计算机不会说中文,过去曾是计算机在中国推广的拦路虎。直到后来唐亚伟发明亚伟中文速录机,王选院士等研究出汉字照排,并解决了巨量汉字字形信息存储和输出等问题之后,电脑才与汉字“兼容”。

  中文博大精深,“有各种各样的表现手法,幽默、夸张、双关、影射等,这些都对自然语言理解有很大影响”,在中科院自动化所宗成庆研究员看来,要真正实现让机器理解并灵活运用中文,还有很多难题要解。

  除了中文本身的特点,报告还提到,如何正确理解图像所包含的语义和情感,也是研究者们面临的一大挑战。比如,对于一个三岁的幼童,父母教给他某个词汇时只需要简单地告诉孩子几个例子即可,根本不需要大规模标注样本,一个智力正常的孩童不仅可以学会新词,而且基本不会用错。可是,现有的神经网络模型一旦离开大规模训练样本,就变得毫无用处。

来源:科普中国网

原文链接:http://www.kepuchina.cn/qykj/rgzn/201612/t20161227_57430.shtml

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn