预告丨“CCF语音对话与听觉专业组走进企业系列活动”第十一期之“走进思必驰”

中国计算机学会中国计算机学会

“CCF语音对话与听觉专业组走进企业系列活动”第十一期之“走进思必驰”将于2020年9月12日上午9:30-11:30在线展开。

“CCF语音对话与听觉专业组走进企业系列活动”第十一期之“走进思必驰”将于2020年9月12日上午9:30-11:30在线展开，本期我们有幸邀请到五位专家介绍思必驰语音及对话领域的最新成果。非常感谢智源社区对本次活动的大力支持，同时欢迎大家积极参加！

主持人

俞凯，上海交通大学计算机系教授，思必驰公司首席科学家。清华大学本科、硕士，剑桥大学博士。长期从事对话式人工智能、语音及语言处理的研究和产业化工作。入选国家级人才工程，NSFC优青，上海市“东方学者”特聘教授，IEEE Speech and Language Processing Technical Committee委员（2017-2019）。中国人工智能产业发展联盟学术和知识产权组组长，CCF语音对话及听觉专业组副主任。发表论文 170 余篇，获得ISCA 《Computer Speech and Language》，《Speech Communication》，InterSpeech Best Paper Award等多篇国际期刊和会议优秀论文奖，以及多个国际研究评测冠军。曾获吴文俊人工智能科技进步奖，《科学中国人》年度人物，CCF青竹奖。

关于讲者

讲者：薛少飞

题目：《思必驰语音语言技术应用与平台化》

简介：薛少飞，2015年博士毕业于中国科学技术大学语音及语言信息处理国家工程实验室，阿里巴巴-中国科学技术大学联合培养博士后。2015-2019年在阿里巴巴达摩院任算法专家。思必驰语音交互技术负责人。主要负责语音识别、语音唤醒等语音交互关键技术的研发和平台化应用。在各类国际会议及期刊中发表论文10余篇，申请国内外专利20余项。

摘要：思必驰是国内专业的对话式人工智能平台公司，拥有语音识别、语音合成、信号处理、自然语言理解等全链路智能语音语言技术，为智能家居、智能车载、智能服务，以及众多行业场景合作伙伴提供自然语言交互解决方案。本报告将介绍思必驰语音语言技术应用情况和平台化架构，希望通过对思必驰整体技术及应用情况的分享，与大家共同探讨语音交互技术的落地场景和未来发展方向。

讲者：钱彦旻

题目：《思必驰语音技术创新进展及上海研发中心介绍》

简介：钱彦旻，思必驰上海研发中心负责人。上海交通大学计算机科学与工程系副教授，博士生导师。清华大学博士，英国剑桥大学工程系博士后。现为IEEE高级会员，同时也是国际开源项目Kaldi语音识别工具包的13位创始成员之一。在本领域的一流国际期刊和会议上发表学术论文130余篇，Google Scholar引用总数超6000余次，3次获得领域内国际权威期刊和会议的最优论文奖，申请50余项中美专利。目前的研究领域包括：语音识别，说话人和语种识别，语音抗噪与分离，语音情感感知，自然语言理解，多媒体信号处理等。

摘要：在真实的环境中，构建精准、高效、鲁棒的语音处理、分析以及识别技术极具挑战，这也是语音及口语对话人工智能技术在落地中的重要核心技术。报告简要阐述语音技术当前面临的诸多挑战，以及在落地真实应用过程中，思必驰公司及其上海研发中心在技术创新方面所取得的一些进展。

讲者：谭天

题目：《极深卷积神经网络：从Aurora4到工业运用》

简介：谭天，2018年博士毕业于上海交通大学。研究领域包括语音识别、自适应等；在语音领域主流期刊及会议发表论文20余篇，2篇进入ESI前1%。现任思必驰语音技术研发工程师，负责语音识别核心技术的算法研发和系统落地。

摘要：深度神经网络提出后，语音识别已经取得了阶段性的进步。在电话语音识别任务中，自动语音识别已经展现出优于人类的性能。然而，在噪声环境下，自动语音识别依然存在巨大性能损失。近几年，极深卷积神经网络相比传统的深度模型获得了更好的识别性能。并且拥有天然降噪能力、更少的模型参数、更快收敛速度等优点。本次报告将为大家介绍思必驰在极深卷积神经网络中的研究进展，主要包括将极深卷积神经网络用于抗噪语音，在Aurora4任务上达到接近人类的性能；以及进一步将极深卷积神经网络落地离线语音识别。

讲者：石开宇

题目：《二值神经网络在语⾳识别中的应用》

简介：石开宇，2019年硕士毕业于上海交通大学。pytorch源码贡献者，研究方向主要包括大规模分布式训练、语言模型和模型小型化。现任思必驰算法工程师，主要负责GPU集群分布式训练工具、ASIC芯片算法研发与落地等工作。

摘要：深度神经网络的应用，使得语音识别的准确率达到了可实用的程度。但是，大规模浮点运算、大内存占用及高能耗的特点，使得深度神经网络不易在低资源设备上应用。低精度神经网络通过减少操作数的位宽，达到了节约计算资源，降低运算能耗的目的。在本次分享中，我们将介绍一种极致的低精度神经网络--二值神经网络以及二值神经网络与乘积量化的结合，并展示它们在声学和语言模型上的应用。

讲者：缪庆亮

题目：《思必驰问答和对话技术研究及应用》

简介：缪庆亮，2011年博士毕业于中国科学院自动化所。先后在富士通研发中心和联想研究院AI实验室任知识图谱和算法专家，带领团队多次获得公司技术创新奖。思必驰知识服务技术负责人，负责核心技术研发和面向企业智能化的产品和业务创新。中文信息学会和情报学会知识图谱专业组委员，申请专利40余项，在各类会议和期刊中发表论文20余篇，带领团队获得TAC-KBP、PAKDD冠军、NLPCC、CCKS等评测前三名。

摘要：问答和对话是实现沟通万物和打理万事的核心技术。近几年来，基于神经网络的语义匹配模型和基于知识图谱的问答大大提升了问答和对话系统的精度。本报告将介绍思必驰问答和对话的核心技术以及在客服系统、文本机器人、质检等业务场景中的应用。语言表达丰富性和多义性给语义匹配带来挑战，如何实现高精度语义匹配实现知识问答。同时，实际对话中伴随着场景主体和关系的变化，利用知识图谱可以实现感知场景主体和关系的变化完成多轮问答。针对结构化数据，半结构化数据和非结构化数据等多源异构数据，如何实现问答对生成和知识问答。强噪环境下闲聊场景的智能回复生成技术。

附会议日程