专访丨文因互联CEO鲍捷

科技工作者之家 2018-12-25

2018年12月14至16日,由中国人工智能学会、永泰县人民政府主办,中国科学技术出版社协办的第二期全国高校《人工智能导论》师资培训班在福州永泰县召开。文因互联CEO鲍捷在现场带来了关于知识图谱的报告。


新一代科技革命蓬勃发展,不断催生新的产业形态和商业模式。金融行业在历经电子化、移动化之后,也进入了金融与科技相结合的新阶段-智能金融时代。因为与数据高度相关,金融行业也一直被认为是人工智能落地最好、最快、最有商业价值的场景。


知识图谱-催化剂、浓缩轴和打折卡


当我们谈到智能金融的技术基石时,更多的人会说机器学习、自然语言理解等,但很少有人会提到知识图谱。但是在众多的智能金融应用场景中,如智能风控、智能投顾、智能投研、智能监管等,很多时候都是机器学习和知识图谱共同发挥作用的结果。


知识图谱最早由Google公司在2012年提出。从学术的角度,我们可以对知识图谱给一个这样的定义:知识图谱本质上是一种叫做语义网络的知识库。从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图。


鲍捷从1998年开始从事人工智能方面的研究,主要聚焦在语义网/知识图谱。鲍捷表示,他对具体算法过程不感兴趣,如何解决问题才是他的兴趣所在。他本人有个穷尽一生想要解决的目标,那就是将世界所有的知识联系在一起,而知识图谱能帮助他完成这一目标。


知识图谱可以说是一种应用于诸多人工智能相关领域的关键技术,它主要应用于数据结构化处理、解析、关联和后续的分析与推理。按照鲍捷的话说,知识图谱是一种催化剂,浓缩轴和打折卡。一方面它能加速价值的产生,在数据聚合中产生新的数据,例如本体映射;另一方面它可以提炼大量知识和数据,是一种流动性好,摩擦力特别小的数据,例如百科数据;它同时也是能降低成本,利用先验知识大幅提高价值的数据,例如基因本体。


“目前国内做智能金融的企业主要聚焦在智能投顾和智能投研方面,人工智能应用在金融行业应用的切入点不应该是这样的。”鲍捷表示,我们所讲的金融大工业化,增强的不应该只是一两个人的能力,而是多人协作的能力。它的核心问题是如何实现金融知识结构的沉淀和业务流程的自动化。


这个难点在于怎样做到用机器理解文档,并且让机器理解金融知识。前一项技术涉及自然语言处理技术,后一项技术涉及知识图谱技术。文因互联所做的事情就是结合这两项技术,在金融行业进行落地。这就要求企业具备全链条的数据结构化能力,包括财务报表的公开化提取能力,还有公告、研报、法规的解析,解析后再进行实体链接,映射到知识图谱上,之后是规则建模与推理、语义搜索、自然语言问答。


希望能在5年时间内,在所有的金融机构、政府、研究机构间构造出一个巨大的近乎实时的数据分发网络,即“金融数据高速公路”,加快各金融机构间的信息流通速度。 



实现AI,不一定需要先了解人脑

历史上,人工智能经历了三起两落。鲍捷表示,未来30年,人工智能会也会继续呈现这种上下波动的趋势。但是这次的热潮肯定跟前几次的不一样,鲍捷给出了以下几点理由:

首先,AI已经结合很多具体场景落地到产业上,有些行业已经创造了几十亿的产值;

其次,从投资上看,之前的AI发展主要靠政府和军方在做支撑,而这次资本的入驻已经给AI的发展提供了大量的助推器;

此外,人工智能的发展,离不开其他技术的支持,如大数据、云。

举个简单的例子,假设我们想造一辆车,光拥有AI这么一块内燃机是不够的。云、大数据、运维系统,这一整套相当于我们车的轮子,传送机制,保险机制。只有结合这些东西,才能造出一辆车,在公路上飞速驰骋。


“我们现在的AI就好像一个破破烂烂的车子,经常漏气漏油,但起码还能用。”鲍捷笑着说道。


事实上,现在在人工智能领域已经产生了一条特别长的产业链条。比如上游有上百万的数据标注师,下游有各种各样的应用场景。一个产业的成熟一定是建立在产业链完善的基础上的。任何行业都会存在泡沫,AI继续崩盘的情况也有可能会继续出现。但是当浪潮退去,能留下来的都是人才,都是好的企业。


现在很多人都认为要实现AI,需要建立在先了解大脑机制的基础上。鲍捷并不赞成这样的观点。举个简单的例子,飞机飞上天时,我们还没有空气动力学这样的理论;在内燃机出现的时候,也还不存在热力学这一理论。AI也是如此。只有当产业界做出产品并开始盈利后,才能形成持续回馈科学的机制,带动学界去给我们解释为什么,然后再靠科学带我们冲出这片“无人区”。


“产业界讲究成本。工程师们往往需要混合使用几百种方法,去不断地试错来完成项目,就像用浆糊把各种零件贴在一起一样。在缺乏足够理论知识下,我们今天做的事跟当年的阿波罗登月项目差不多,就是要用落后的技术实现20年后的效果。”鲍捷说。


专访人物介绍



鲍捷,文因互联CEO,联合创始人。研究领域涉及人工智能多个方向,如自然语言处理、语义网、机器学习、描述逻辑、语义维基、上下文建模、语义信息论、规则语言、封闭世界推理、策略建模、语义数据集成、模块化本体、协作本体构建、网络隐私保护、神经网络、数据挖掘和图像识别等。在 International Joint Conferences on Artificial Intelligence (IJCAI)、International Semantic Web Conference (ISWC)、Extended/European Semantic Web Conference (ESWC), 和 Asian Semantic Web Conference (ASWC) 等期刊和会议上发表 70 多篇论文。曾任 W3C OWL(Web本体语言)工作组成员,在此期间,合作撰写了OWL2 的 W3C 规范文档。先后参与组织 50 多场国际学术会议和学术研讨会,并任中国中文信息学会语言与知识计算专业委员会委员、W3C顾问委员会委员、中国计算机协会会刊编委,中文开放知识图谱联盟(OpenKG)发起人之一。


采访记者丨 亿欧 赖燕芳

未经授权严禁转载及翻译

如需转载合作请向学会或本人申请

转发请注明转自中国人工智能学会

来源:CAAI-1981 中国人工智能学会

原文链接:http://mp.weixin.qq.com/s?__biz=MjM5ODIwNjEzNQ==&mid=2649791429&idx=3&sn=8f300c58b734bdf0431af9414cbb1fae&scene=0#wechat_redirect

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

人工智能 技术路线图 史忠植

推荐资讯