数据科学家闵万里:透过数据之眼,看见未知预测未来

科技工作者之家 2018-05-17

芝加哥大学,位于美国的密歇根湖畔,古色古香的哥特式建筑风格让它散发出天然浓郁的学术气息和文化氛围。

至今,闵万里仍会怀念在芝加哥大学度过的七年时光。在那里,探索未知仿佛就是生命的全部,对他而言,那不仅是走进知识,也是走出时间。

也是在那里,闵万里做出了人生最重要的决定之一。

u=3757515781,1684224654&fm=214&gp=0.jpg

1999年,互联网泡沫席卷欧美。当大批理工科学者转向计算机编程,以软件工程师的身份进入硅谷,轻而易举获得年薪十几万美元的收入,物理学硕士毕业的闵万里却选择了投身统计学。

闵万里承认,诱惑非常大,但并不是他想要的。在自己感兴趣的领域充分积淀,从而达到全新的理论高度,这才是闵万里所渴望的终身财富。

随心而为,绝不随波逐流。无论是14岁去中国科学技术大学读少年班,在芝加哥大学转型统计学研究,还是毕业时选择IBM研究所,留美16年后毅然回国,闵万里始终坚持这一点。

18年前特立独行的决定,成就了一位大数据时代炙手可热的数据科学家,这是闵万里自己也未曾想到的。但他相信,因兴趣而产生的自我驱动力,终究会推动一个人走得更快、更高、更远。

被神化的少年班

1978年,21名早慧少年被选拔进入中国科学技术大学,一时间,少年班名动天下。

美国科学院最年轻的华人院士庄小威、打破了华人年龄纪录晋升的哈佛教授尹希、发现世界上最小的纳米碳管的秦禄昌、发明原子陷阱追踪分析法的卢征天……许多少年班校友正活跃于经济、IT、金融、制造等领域,并做出令人瞩目的成绩,闵万里便是其中之一。

出身于安徽大别山区的闵万里,是当地出了名的“少年神童”。1991年底,在一次奥林匹克竞赛冬令营培训上,中科大的教授一眼便选中了这个在数学思维方面表现出过人天赋的孩子。仅针对重点中学才给予的报考资格,落在了闵万里的头上。

自理能力弱、心理偏差、交往障碍,神童退学案例的发生,让曾经缔造神话的少年班培养模式,一度引起强烈的争议。但在闵万里看来,社会适应能力的缺乏并非少年班独有的现象。

中科大少年班的学生入学后,并不立即分专业,而是打下扎实的数理基础,才在全校范围内自由选择学科平台。注重挖掘学生潜能的通识教育模式以及充分尊重个人兴趣的个性化培养机制,让闵万里受益终身。

“少年班并不是拔苗助长,而是因材施教。基于兴趣为导向的专业选择,是少年班最大的优势。”这恰恰是闵万里最为看重的“自我驱动”。

男孩问女孩喜欢什么,女孩答喜欢学习。这不是网络段子,而是真实发生在闵万里身边的故事。“当你在学习中真正体会到探索未知世界的乐趣,那一定是兴趣使然。”

行业价值的创造者

一个沉迷于挖掘数据价值的理工男,却偏偏爱好写诗、作词、谱曲,这或许是闵万里总是自带儒雅气质的原因所在。

每到周末,闵万里便会带着家人远离城市的喧嚣,在乡间田野享受内心的宁静。“如果始终忙碌奔波在城市里,视野都被钢筋水泥所阻挡,唯有望向天空才有一线生机,那不就成了井底之蛙?”

每天提前一小时到办公室是闵万里的习惯,这是他在碎片化的时间中仍能抽出时间酝酿和沉淀自己的诀窍。

闵万里格外珍惜远离世俗的时间,正如他做任何决定从不喜欢被世俗思想所左右。

“为什么不去华尔街?”2004年,博士毕业的闵万里放弃华尔街的邀请,选择了IBM研究所,这让周围朋友感到不可思议。

其实早在一年前,闵万里还在IBM研究所实习时,当他亲身见证了研究成果与实际商业场景结合所产生的巨大价值,就已经做好了决定。“从实践中抽象出来的课题才最具生命力。”闵万里认为,学术研究与商业应用之间需要一种良性双向互动机制。“与华尔街不同,在工业界的研究所里,你可能改变的是一个行业。”

这样的改变的确在发生。

闵万里带领他的团队所研制出的阿里云人工智能ET,不仅通过精确预估餐厅出餐时间、骑手个性化骑行速度、取餐等待时间,为外卖骑手提供最佳路线,明显提高了外卖配送效率;而且将高速历史数据、实时数据与路网状况结合,预测未来一小时内的路况,并成功上线了全球首创的“互联网+信号灯”,极大改善了城市交通拥堵的现状。

去年,闵万里更将人工智能瞄准了艺术鉴赏,阿里云人工智能ET成功预测出了《我是歌手》第四季的歌王。“即使目前人工智能还无法实现自我创造,但可以试图理解创造的过程,无限地逼近。至少现在我们证明了人类的情感行为是可以用理性的公式模拟出来的。”

3月29日,在云栖大会·深圳峰会上,闵万里的团队宣布推出ET工业大脑和ET医疗大脑。前者是利用人工智能技术发挥“中国智造1%”的威力,而后者则用人工智能的方法识别医疗图像,致力于打造永不退休的医生,将技艺传承。

人是一切数据的总和

从转型统计学开始,闵万里的研究就始终围绕着数据。对于他而言,数据犹如一双眼睛,可以看见未知预测未来,算法则是透视数据的手段。

“整个社会经济体的运作都可以用数据来概括,只要找到正确的分析方法,就可以获得对物理世界的现象和人的本质更深刻的理解。”闵万里认为,当数据能够360度还原一个人的时候,人便是一切数据的总和。

在闵万里看来,如果数据不能被计算,就是沉睡的金矿。“我们通过计算这个杠杆,来撬动整个社会中沉睡的公共数据资源,把底层的价值释放出来,由此产生的价值是无法想象的。”

数据的魅力令闵万里着迷,这也正是他留美16年后选择回国的最大源动力。

“当我得知,一家中国企业所拥有的客户数据量,比eBay、亚马逊、PayPal加起来还要多的时候,对我来讲这一句话就足够了。”研究大数据,当然要去数据更海量,场景更丰富的地方,闵万里坚信,这将是一个巨大的发展空间。

离开了16年后回国,文化认知、生活习惯、工作方式、社会关系等各方面的差异,必然意味着一切从零开始。“1997年我出去的时候一无所有,而现在我拥有能力和经验,我不应该畏缩,就把这一次当作第二次创业。”

海归,心归人也要归。闵万里认为,只有走近客户身边,才能真正了解他们的痛点和需求,创造最大的价值。

人人皆谈人工智能,然而缺乏基础性、原创性的研究,是闵万里回国后最为头痛的问题。“人工智能的竞争归根结底是算法的竞争,对数学掌握具有很高的要求,而当今国内在这个领域中数学出类拔萃的人不多,因为他们接受的是计算机的训练。”闵万里表示,下一代人工智能要取得超越性发展必须从数学系培养人才,这样才会具备理论创新的可能性。

来源:中国青年网

作者:朱梦琪 秦亮