【进博会-2019智能科技论坛】百度公司首席技术官王海峰:人工智能已经进入工业大生产阶段

科技工作者之家 2019-11-08

来源:中国电子学会

2019智能科技与产业国际合作论坛

       11月6日,2019智能科技与产业国际合作论坛在第二届中国国际进口博览会现场成功举办。论坛由中华人民共和国工业和信息化部主办,中国电子学会承办。本次论坛以“共创智能新生态 共享智能新时代”为主题,汇聚政、产、学、研界众多精英智慧,多视角分享全球智能科技产业前瞻观点及国际合作愿景,聚焦未来科技融合交流发展前沿课题。百度公司首席技术官王海峰做了题为《AI大生产平台》的主题演讲。

多谢龚克主席的介绍!


我也是第二次来到这个论坛去年讲的AI是新的生产力,因为去年已经看到人工智能改变各行各业带来新的一次工业革命的势头已经出现了,过去一年发生了什么,我认为一方面人工智能的技术仍然持续发展,作为这样一次新人类工业革命的核心科技,本身远远没有达到天花板,仍在高速发展。


更重要的是人工智能技术已经广泛应用于我们生产生活当中,在这个产业里面不断的有需求出现,同时产业的平台,产业的数据等等在支撑人工智能技术本身的发展。


一年下来,我认为现在不仅仅是新的生产力已经进入工业大生产阶段,我们知道人类历史上几次工业革命,比如说第一次工业革命有机械技术,第二次工业革命有工业技术,第三次是信息技术,每一次革命要大面积的影响生产生活,这些都是有工业大生产广泛应用,这些技术有广泛通用性,并且表现出工业化、模块化、标准化很强的生态特征,影响我们生产生活就开始迅速加快,AI现在已经进入这样的阶段。当然首先是AI技术。


这一点刚刚前面也基本讲过了,就是人工智能已经成为新一轮科技革命和产业变革核心驱动力量,人工智能作为一项技术,百度做这项技术有20年,过去10年集中投入在做。这10年中,人工智能集成经过几年的发展,从2012年全部布局人工智能技术,经过了六年时间已经形成基础能力比较完整的布局,并且开放出来。


人工智能时代是我们尤其需要开源开放的时代,百度大脑也是在这样理念指引下,在2016年开放出来。


去年我讲的时候还是侧重人工智能技术,已经进入动态深度语音理解的阶段,不管语言、视觉、图谱方方面面我们整合起来有多模态深度语音理解能力,这个更多从技术角度来看,今年已经整合成软硬一体AI大平台,而且在很多应用场景得到广泛应用,并且跟这些应用场景进行融合创新。


既然讲大生产平台,我讲一下我理解大生产平台是什么样子,当然一个AI系统包括有基础的算力和算法的支撑,在此基础上很多朋友都知道现代人工智能技术一个很重要的技术就是深度学习,我们也打造了一整套百度深度学习平台,而且跟合作伙伴有合作,华为的蒋总也在,我们跟华为有很多合作,基于这样的学习平台构建了很多能力,跟人感知相关的语音技术,包括跟人认知相关的语音知识等等这些,所以有相应的语音处理和知识图谱技术。


有了这些技术以外,为了应用各种场景里面会定制应用平台,这些平台会定向垂直应用场景进行定制优化,有了这些以后我们进行部署,不同应用场景里面布局,包括很多边缘的部署进而形成完整的解决方案,相比去年除了这个图本身更丰富了,如果记得我去年讲的东西,我们现在右边加了很重要的一个方面,当然以前做的都很重视安全,现在安全也有共性,早上我还和龚克校长讨论的安全包括每个模块,我们做每一个事情都有相应安全维度的考虑。


首先说算力,软硬一体的算力平台,从底层的芯片到各种互联,我们知道现在互联其实是非常重要的一件事情,不管芯片间、结点间、计算与存储间等等,我们做大规模算力的时候,肯定涉及到各种互联,包括现在随着另一个很热门的技术就是5G,5G也会带来新互联,也会带来新的计算架构的改变,再往上就是系统以及资源算力等等各种调度。


当然我们为了构建这样大的算力平台,会用到很多不同合作伙伴的技术,但是百度自己针对AI的应用也开发了一些相关的芯片。比如说像云端通用芯片,就是昆仑芯片,现在也已经流行了,我讲软硬一体的优化,不仅仅是一块通用AI芯片,而且会针对深度学习,除了通用芯片也有专用芯片。


这里讲一款原厂语音芯片,现在语音已经用的非常广泛,语音除了追求效果好以外,现在在各种场景下,比如说在各种智能家居的设备,移动设备,车载设备上还有很多其他要求,比如说对于功耗要求等等,这些需求把信号处理,本身语音建模把这些东西集成起来,得到更好效果的同时,有一个更高效的能耗支持。


接下来就是算力基础,我认为深度学习框架和平台是智能时代操作系统,为什么这么说,芯片要想到做到更好的效率和效果,也要针对深度学习平台进行优化,所以深度学习平台向下对接芯片,向上有各种AI不管通用能力还是定制应用也会基于这样深度学习平台构建,它处在这样一个承上启下的位置,我认为是智能时代的操作系统。


这个很巧,昨天上午我在北京发布了飞桨,经过一年发展构建了新的发展体系,框架里面有基本的开发训练推理这些基本能力以外,我们上面又有很多丰富的模型库,端到端的开发套件,工具组建,服务平台,这一整套组成完整的深度学习平台,一整套每一层不同的开发者,不同的应用,都可以拿自己所需的东西构建自己的应用这样才是完整的深度学习平台。


综合我前面讲的图各层叠加起来,我们认为抽象出来,有四大比较领先的飞桨的技术,包括从开发的角度,非常便捷深度学习框架,可以支持超大规模训练,超多规模的布局,以及深度学习的产业模型库。


昨天又增加了很多产业模型库,从开发的角度,网络的自动构建一个神经网络有几个结点,什么网络结构,这是经过很多专家积累做好的。现在我们可以自动做网络设计,而且它的效果甚至比人类专家设计出来的网络还要好,另一方面就是组万式深度学习范式,深度学习有时候支持动态图,有时候支持静态图,但是多数框架程序员写的时候和平时写程序逻辑不太一样。


我们做的这一套和程序员做的编程逻辑是相同的,这样更容易上手,超大规模的训练,我们知道数据越来越大,算力越来越强,尤其是大的计算平台,即使平台很大,我们怎么支撑巨大无比的算力。比如说计算,我们现在做已经可以支持万亿级的深度学习训练,不仅仅是训练,同时很重要一点,它会及时进行更新,这样保证模型现在效果好,而且有新的不断效果变的更好。


我们有了模型以后,我们有可能部署在云端,有可能部署在各种端上,包括手机上、智能音箱上等等,面对不同的操作系统,所以多端多平台的部署能力非常重要,比如说移动端可能需要很小,一个库有可能就是一兆,而在云端就是巨大的模型。


我们也试了一下通用架构推理速度,这个就不详细讲了,大家可以看到这个图,飞桨也达到了非常好的速度,同时我们跟华为合作的时候,跟MPO合作,也进一步让速度得以变的更快。


非常丰富的产业建模库,有人做资源处理,有人做视频,有人做语音等等,同时我们主要证明它的效果进行横向对比,也参加了国际评测,在很多任务里面得到了最好的结果,基于前面不管算力也好,还是深度学习平台也好,百度大脑的这种感知和认知能力是建立在这上面,涉及到听觉,视觉,语音,知识等等。


比如说这是百度语音发展历程,现在已经发展流失多级注意力,阶段注意力模型,这样一个模型不仅识别效果本身好,同时它也带来了更好识别方言,更好抵抗噪声,以及中英文混合识别等等。给大家听一下。


大家听到这一段就是我的一个同事再一个发布会上现场拿着手机说的,这种如果大家熟悉语音识别,这种快语言识别很难,基于我们这一套Smart这样的技术已经解决很好,语音合成基本上主流技术都在用Unite等等这些,同时我们对音色情感结耦,不仅实现很好,而且可以实现定制。


大家听到这一个孩子的声音,这是我的同事让他孩子录了二十句话,这是他每天出门的时候导航都是他孩子的声音,不仅是我的同事,大家也可以这样做。增强现实,语音现实做软硬一体等等这是百度视觉整体这样的平台。我不详细每一样讲了。时间关系还有五分钟左右。


前面讲的图象,包括三维视觉以及增强现实技术,屏幕右边就是虚拟主播我们跟银行合作,一个数字员工,跟不同企业合作,都可以做数字人,跟不同企业合作,做数字员工等等这些,视觉也是需要这样的矩阵,触摸开发到应用场景等等。认知层,语音和知识,知识是人类认知基础,对于计算机来讲,虽然现在深度学习很强大,但是仍然涉及到知识,不管实体图谱,关键点图谱等等,涉及到事件挖掘,整合补全,索引计算,上面的语言,词法,句法语音层级,以及理解,从不同维度生成,进而支持语言和知识相关的各种应用。


更重要的一点现在自然语言处理能力现在最重要的进展,像word或者百度预训练模型语音理解的能力,百度ERNIE是知识的增强,并且推动学习持续理解的语言框架,这样也刷新自然语言处理的任务,大家看到上面那条线变得很好,更好的模式是不断加新的模型进来,这个模型学习能力不断持续新的增加。除了理解之外,比如说交互,比如说对话等等,刚刚我们提到数字客服,后面也涉及到对话的能力,这个涉及到对话能力,对话管理等等。


另一方面就是语言生成,可以自动写一篇文章,可以辅助自动完成创业,帮你选题以及选择素材,以及更好的发布系列,安全在安全上做矩阵,平台做开放式的安全解决方案,以及构建完整的生态。前面是讲所有这些相关的技术,这个ABC就是百度我们讲智能云,实际上基于人工智能大数据,依托这个云赋能产业的变革和创新。


涉及到很多行业,上面列的行业我们上面都有,在这个行业里已经做了很多赋能这个行业的工作,比如说工业里的智能巡检,全方面的进行安全的监控,大家看到比如说我们识别是不是有人没有戴安全帽现在都已经识别非常准,包括识别火警、识别仪表等等这些;气象也是,我们可以做气象方方面工作,不仅效率变好,时延也变短。


现在临床辅助决策系统,已经得到很广泛的应用,包括前一段CDSS也专门医疗,尤其赋能基层医疗做了一个专题,包括智慧场馆的建设,智能媒体的服务,这个国庆间跟央视网合作,比较长的视频,想截其中一段视频怎么办,可以靠百度大脑相关的能力,看某一个人某一个场景自动截取出来,人再加工,效率高很多,可以得到剪辑以及标注理解。总体看出来这样的AI大平台已经开放216,每天有1万亿,每天150万开发者做了大量的模型,我认为人工智能已经进入工业大生产阶段,已经不断人工智能赋能各个行业包括产业深化升级,也帮助我们生活的变得更美好!


谢谢大家!


来源:cieinfo 中国电子学会

原文链接:http://mp.weixin.qq.com/s?__biz=MzA4MTgwMjkyNw==&mid=2657301479&idx=1&sn=388bb3446cba28fcb7f51d6d5f9bd154&chksm=8418f027b36f7931a1f26edeca4138511596bc82c4a7abb0e1256eff29634a2406d9e7cf5cf9&scene=27#wechat_redirect

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn