吴奖人物丨深耕视觉AI领域,赋能产业升级——访ArcSoft虹软CTO兼首席科学家王进

科技工作者之家 2019-02-25

人工智能人物访谈篇之二十

王进博士在计算机视觉(CV)和视觉人工智能(AI)技术革新与产品化、规模化落地应用中,有着卓越贡献,为产业和全社会都创造了巨大价值。其在全球智能手机、数码相机,功能手机和相机所有的关键AI和CV技术研发和产品化中,扮演首创和导引的角色,带领团队将相关技术已经成功应用于近百亿台移动智能终端设备。


获奖人物介绍



王进,ArcSoft虹软CTO兼首席科学家,毕业于浙江大学CAD&CG国家重点实验室,一直专注于计算机视觉、人工智能、计算机图形学、嵌入式平台优化、端+云智能平台等领域的研究。王进博士主导的相关技术成功应用于近百亿台智能、嵌入式终端设备。他主导研发的单、多摄技术,智能美颜技术,各类摄像头、图像、视频质量增强等手机的主要多媒体和AI技术,在全球手机(苹果外)市场占有率超过80%。20多年来,王进博士对CV&AI在智能、嵌入式终端的研究和产业化落地领域做出了重要贡献,为相关产业创造了十分可观的价值。2017年,王进博士主导完成首个离线免费开放的视觉人工智能开放平台,打破AI的技术壁垒,让行业能够低门槛、零成本使用CV&AI技术,也为数据独立安全提供重要保障,使产品性能、鲁棒性得到质的提升,为产业升级与行业创新增加新动力。2018年,王进博士主导完成的《虹软智能摄像头影像优化解决方案》获得人工智能领域最高荣誉吴文俊人工智能科学技术奖。



人工智能人物:虹软为何选择视觉领域作为核心业务方向?


王进:虹软的开创者,包括我们的总裁兼CEO邓晖先生都是计算机视觉的专家,虹软的创立就是致力于将视觉技术深入到人们的生活中。虹软最核心的技术主要就是计算机视觉和人工智能技术,它们就像是一对孪生兄弟,无法孤立开来。因为二者天然就蕴含相对较难的理论点和技术点,需要逐个去攻破。几十年来,吸引了诸多科研人员从事该领域,而虹软无疑是其中最优秀的一员,这也让我们可以吸引到更多优秀人才加盟。近二十年来虹软聚集了一大批顶级甚至世界级的视觉AI人才,他们和我一样热爱着视觉AI领域。在这样一个团队和氛围里工作,充满了享受及成就感。


而另一方面,视觉AI研发难、耗时久等特点,也导致随着时间的推移,公司凭借在该领域内建立起的高门槛,而更具持久生命力。这些因素让我们在全球的数码相机、功能手机、智能手机等嵌入式设备所需的关键视觉AI技术研发、产品化过程中,能长期扮演着引导和主导的角色。


此外,诸多积累的经验和技术,构建起来的技术能力有助于虹软可以很快地将技术切入到更多的领域,如智能驾驶、智能家居、智能零售、IoT物联网等智能设备,并同样地快速建立起高门槛。


人工智能人物:虹软作为视觉人工智能技术应用的领军企业,您对人工智能技术应用和产业化有何见解?


王进:人工智能并不是一个新鲜事物,它已是一个几十年的老话题了。它的发展经历了几个里程碑阶段,目前,受到大家的关注, 是因为现在的深度学习架构把它推到了一个更高的层次,在一些领域内它能产生切实有效的应用效果。


但是,人工智能不是一个单纯的“风口”,它无疑将会是一个长期的进步过程。目前的研究成果还存在很多原理上的限制,所以不能盲目“跟风”。作为从事AI方向的企业,应该尽可能从外行变为内行,千万不能不求甚解。其中的关键点是理论和实际落地都要成为“内行”,这样才可以在特定垂直细分方向分析后选择正确的发力点,研发出切实可用的AI技术和产品。



人工智能人物:能介绍一下虹软现有的产品吗?


王进:按照CV&AI的整个体系,可以把虹软已有的产品划分为如下几个部分:


视频、图像获取的产品包。基于公司二十多年的数字图像和视频领域的技术积累,虹软拥有单摄像头(单色、彩色、红外)、双摄像头、多摄像头、深度摄像头的不同Capture解决方案,主要作用是摄取质量更优的原始视频、图像;得到原始数据后,虹软可以提供一整套视频、图像质量提升的解决方案包,核心目的解决四个问题:噪音、模糊、亮度、视域。这些解决方案包有很多种方法和模式以适用于不同的设备、平台、环境;有了前面的基础技术,虹软还可以提供最完整的人物相关整套云端、设备端的检测识别包:人脸检测、识别、人脸20多种属性的识别;身体的检测、跟踪,骨架检测跟踪、动作的识别、驱动,建模,饰物和衣物的识别;手势的检测、识别,动作的识别、驱动,骨架的识别、驱动;这3个子包都支持二维和三维。物体和场景的检测和识别,我们总结了日常生活中常见的2000多种对象,均可实现检测、识别;基于深度摄像头、彩色摄像头的三维物体重建。


虹软是全球最早推出人脸美化(美颜)技术的公司,现在有一整套2D、3D美颜、美妆技术包。拥有成熟的产品化的SLAM引擎与三维图形绘制引擎。


从逻辑应用的角度讲,虹软有产品化的手机、汽车、无人零售、智能家居、VR&AR,机器人、直播、安防、保险、物流、制造、农牧的行业视觉AI解决方案。


人工智能人物:能介绍一下您的团队吗?


王进:我最自豪和幸运的是拥有一支非常特别的研发队伍。我的管理很少、很简单。对于团队的成员,事实上我很少对外称呼他们是员工。他们可以比喻为一支“特种兵”队伍,都是精华,品行兼优!大家像兄弟姐妹一样亲密无间,随着时间的推移,这种内在的情感、情谊越来越深。同时,团队积淀很深,拥有CV&AI领域的各个层面的丰富经验和代码、库、规范的积累;可以快速研发新方向,快速落地、产品化。


人工智能人物:您认为获得“吴文俊人工智能科学技术奖企业技术创新工程项目”后,对虹软会产生哪些有力支撑和影响?


王进:获得这个重要奖项,对虹软无疑是一种肯定和激励。它会激励虹软再接再厉,在人工智能和计算机视觉领域继续努力,坚守创新的心态,争取尽快地解决当前依然存在的各种各样的理论和技术问题。未来,虹软会继续保持在视觉AI行业的技术优势,为行业提供更着地的视觉人工智能技术,使行业发展更加健康。


同时,鉴于该奖项的重大影响力,相信各行业的企业会更了解虹软,更希望与虹软进行深度合作,也会与我们一起针对硬件、光学、机械、IC、数据等方方面面有着相互的交流与学习,携手推动CV&AI更多的开花结果,推进行业的赋能升级。


人工智能人物:虹软未来的研究发展方向是什么?有什么最新进展?


王进:24年来,虹软在多媒体和人工智能领域已积累了很多技术与产品,且现在业务蓬勃发展。接下来,我们将以开放技术为核心,尝试以平台的形式进一步加大虹软能够赋能的领域。未来将进一步巩固与完善虹软视觉人工智能开放平台的开发环境,并不断丰富其功能。同时,虹软也将尝试开放更多免费资源,降低影像处理,摄像头技术,计算机视觉技术、人工智能技术的使用门槛,让技术使用逐步达到开发平民化。现在开放给大家的虹软人工智能开放平台仅一年时间,我们已免费开放人脸识别、活体检测、人脸角度检测、人脸属性分析、人证核验等多种SDK,并且取得了不错的成果。


另外,在合适的时机,我们会扎实稳步地涉足CV&AI相关的更多应用领域。业界会一点点看到。



人工智能人物:您的获奖感言是什么?


王进:衷心感谢评审专家们对虹软技术的认可和肯定,授予我们这个重要奖项。它会激励我们再接再厉、更加努力,取得更好的成绩,为CV&AI的研发做出更多的贡献。也衷心希望吴文俊人工智能奖越办越好,长久不衰,成为AI行业发展的原动力。


获奖项目成果


由于智能手机等移动智能终端物理特性的限制,在单摄像头上通过镜头光圈去实现例如景深效果、前/背景虚化等高要求成像功能,对于手机摄像头模组的厚度和整体外观设计都有很大的难度。而虹软此次获奖的方案,正是利用了独创的AI算法为智能手机解决了这一难题。通过采用整套解决方案,可以在既有的摄像头硬件能力基础上全面提升摄像头的成像质量,并深化和扩展智能手机摄像头的成熟应用。


该解决方案由单摄像头影像套装软件和多摄像头影像套装软件两大部分组成。其中,单摄像头影像套装软件是通过高性能算法,自动检测出不同的拍摄场景,然后通过调节相机原始参数及公司的多帧拍摄合成技术,以达到最佳拍摄效果。而多摄像头套装软件则是利用多摄像头硬件工作的优势,将分工合作的摄像头所捕捉的不同照片,结合虹软公司的高级图像融合算法,在噪点、亮度、色彩、细节等图像质量方面以及整体处理性能方面达到一个最好的平衡点,使多摄像头拍摄发挥出最大的功效,完美地实现例如前景虚化、背景虚化、自动对焦、扩增实境等功能,从而获得类似于单反成像效果的照片。


整套方案中虹软所研发的图像精密对齐算法及图像合成算法,及时填补了该领域的空白。该图像对齐算法,将存在视差的长焦图像和广角图像,可以在非视差区域精确对齐,为下一步的图像融合算法,在融合效果上获得保障。而图像合成算法,则可以在视差区域和非视差区域,衔接自然,使得整个结果图浑然一体。


目前,该智能摄像头优化解决方案已被 80%以上的国内外手机厂商采用。该方案的研发成功,意味着智能手机实现无损光学变焦成为了可能,同时也让手机摄像头的部分拍摄效果达到了单反的质量,这在整个智能手机拍照领域都是一项巨大的变革!因为这不仅地推动了智能手机摄像领域的产业发展,而且推进了智能手机发展迈向了新的时代。


获奖者寄语


王进:借此机会把参加一个活动的内心感受与同仁们分享一下: 十天前参加了一个金融领域的交流观摩活动;活生生的人、事,就在眼前亲耳听闻,自己几度热泪盈眶。在边缘省份,一线工作者为了一个事故有时需要跑上千里路,一些不起眼的小因素甚至会导致生命丧失。其实,不少损失都可以避免,只要用上实实在在的技术即可,不需要虚无缥缈的说词。


当下,人工智能是一个可爱的婴儿,少炒作,给他一个可以呼吸的空间,呵护着他健康成长吧。


来源:CAAI-1981 中国人工智能学会

原文链接:https://mp.weixin.qq.com/s?__biz=MjM5ODIwNjEzNQ==&mid=2649791869&idx=2&sn=c43f09e7b6be360f7854d8d871f1f49e&scene=0#wechat_redirect

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

人工智能 计算机视觉 arcsoft

推荐资讯