专访丨文因互联CEO鲍捷学术资讯

2018年12月14至16日，由中国人工智能学会、永泰县人民政府主办，中国科学技术出版社协办的第二期全国高校《人工智能导论》师资培训班在福州永泰县召开。文因互联CEO鲍捷在现场带来了关于知识图谱的报告。

新一代科技革命蓬勃发展，不断催生新的产业形态和商业模式。金融行业在历经电子化、移动化之后，也进入了金融与科技相结合的新阶段-智能金融时代。因为与数据高度相关，金融行业也一直被认为是人工智能落地最好、最快、最有商业价值的场景。

知识图谱-催化剂、浓缩轴和打折卡

当我们谈到智能金融的技术基石时，更多的人会说机器学习、自然语言理解等，但很少有人会提到知识图谱。但是在众多的智能金融应用场景中，如智能风控、智能投顾、智能投研、智能监管等，很多时候都是机器学习和知识图谱共同发挥作用的结果。

知识图谱最早由Google公司在2012年提出。从学术的角度，我们可以对知识图谱给一个这样的定义：知识图谱本质上是一种叫做语义网络的知识库。从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图。

鲍捷从1998年开始从事人工智能方面的研究，主要聚焦在语义网/知识图谱。鲍捷表示，他对具体算法过程不感兴趣，如何解决问题才是他的兴趣所在。他本人有个穷尽一生想要解决的目标，那就是将世界所有的知识联系在一起，而知识图谱能帮助他完成这一目标。

知识图谱可以说是一种应用于诸多人工智能相关领域的关键技术，它主要应用于数据结构化处理、解析、关联和后续的分析与推理。按照鲍捷的话说，知识图谱是一种催化剂，浓缩轴和打折卡。一方面它能加速价值的产生，在数据聚合中产生新的数据，例如本体映射；另一方面它可以提炼大量知识和数据，是一种流动性好，摩擦力特别小的数据，例如百科数据；它同时也是能降低成本，利用先验知识大幅提高价值的数据，例如基因本体。

“目前国内做智能金融的企业主要聚焦在智能投顾和智能投研方面，人工智能应用在金融行业应用的切入点不应该是这样的。”鲍捷表示，我们所讲的金融大工业化，增强的不应该只是一两个人的能力，而是多人协作的能力。它的核心问题是如何实现金融知识结构的沉淀和业务流程的自动化。

这个难点在于怎样做到用机器理解文档，并且让机器理解金融知识。前一项技术涉及自然语言处理技术，后一项技术涉及知识图谱技术。文因互联所做的事情就是结合这两项技术,在金融行业进行落地。这就要求企业具备全链条的数据结构化能力，包括财务报表的公开化提取能力，还有公告、研报、法规的解析，解析后再进行实体链接，映射到知识图谱上，之后是规则建模与推理、语义搜索、自然语言问答。

希望能在5年时间内，在所有的金融机构、政府、研究机构间构造出一个巨大的近乎实时的数据分发网络，即“金融数据高速公路”，加快各金融机构间的信息流通速度。

实现AI，不一定需要先了解人脑

历史上，人工智能经历了三起两落。鲍捷表示，未来30年，人工智能会也会继续呈现这种上下波动的趋势。但是这次的热潮肯定跟前几次的不一样，鲍捷给出了以下几点理由：

首先，AI已经结合很多具体场景落地到产业上，有些行业已经创造了几十亿的产值；

其次，从投资上看，之前的AI发展主要靠政府和军方在做支撑，而这次资本的入驻已经给AI的发展提供了大量的助推器；

此外，人工智能的发展，离不开其他技术的支持，如大数据、云。

举个简单的例子，假设我们想造一辆车，光拥有AI这么一块内燃机是不够的。云、大数据、运维系统，这一整套相当于我们车的轮子，传送机制，保险机制。只有结合这些东西，才能造出一辆车，在公路上飞速驰骋。

“我们现在的AI就好像一个破破烂烂的车子，经常漏气漏油，但起码还能用。”鲍捷笑着说道。

事实上，现在在人工智能领域已经产生了一条特别长的产业链条。比如上游有上百万的数据标注师，下游有各种各样的应用场景。一个产业的成熟一定是建立在产业链完善的基础上的。任何行业都会存在泡沫，AI继续崩盘的情况也有可能会继续出现。但是当浪潮退去，能留下来的都是人才，都是好的企业。

现在很多人都认为要实现AI，需要建立在先了解大脑机制的基础上。鲍捷并不赞成这样的观点。举个简单的例子，飞机飞上天时，我们还没有空气动力学这样的理论；在内燃机出现的时候，也还不存在热力学这一理论。AI也是如此。只有当产业界做出产品并开始盈利后，才能形成持续回馈科学的机制，带动学界去给我们解释为什么，然后再靠科学带我们冲出这片“无人区”。

“产业界讲究成本。工程师们往往需要混合使用几百种方法，去不断地试错来完成项目，就像用浆糊把各种零件贴在一起一样。在缺乏足够理论知识下，我们今天做的事跟当年的阿波罗登月项目差不多，就是要用落后的技术实现20年后的效果。”鲍捷说。

专访人物介绍

鲍捷，文因互联CEO，联合创始人。研究领域涉及人工智能多个方向，如自然语言处理、语义网、机器学习、描述逻辑、语义维基、上下文建模、语义信息论、规则语言、封闭世界推理、策略建模、语义数据集成、模块化本体、协作本体构建、网络隐私保护、神经网络、数据挖掘和图像识别等。在 International Joint Conferences on Artificial Intelligence (IJCAI)、International Semantic Web Conference (ISWC)、Extended/European Semantic Web Conference (ESWC), 和 Asian Semantic Web Conference (ASWC) 等期刊和会议上发表 70 多篇论文。曾任 W3C OWL(Web本体语言)工作组成员，在此期间，合作撰写了OWL2 的 W3C 规范文档。先后参与组织 50 多场国际学术会议和学术研讨会，并任中国中文信息学会语言与知识计算专业委员会委员、W3C顾问委员会委员、中国计算机协会会刊编委，中文开放知识图谱联盟(OpenKG)发起人之一。

采访记者丨亿欧赖燕芳

未经授权严禁转载及翻译

如需转载合作请向学会或本人申请

转发请注明转自中国人工智能学会