推动大数据落地 北京大数据研究院发布一批技术成果

科技工作者之家 2018-09-04

  近日,“分子动力学模拟平台”“基于大数据的宏观经济分析”“新一代指纹识别技术”等一批技术成果在中关村示范区展示中心集中发布,成为北京大数据研究院成立三年来最有分量的荣耀。

  重点技术成果之一的“分子动力学模拟平台”,是一个开放的基础科研计算平台,其核心软件名为DeepPMD-kit,采用Python/c++编程语言,支持安卓系统,可对常见材料和分子体系构建系统力场,为特定用户指定的特定体系生成准确的力场模型。

  “这将推动整个模型领域发展,是基础科学的重要研究工具,在化学反应、高精尖材料、药物设计等方面有重要的应用前景。”成果发布人张林峰表示,它通过基于机器学习的力场模型(Deep Potential)和新的数据抽样方法(Reinforced Dynamics),解决了长久以来分子模拟精度与效率难以兼顾的难题。目前,此平台已经应用于高温合金、反应力场、物质相图研究、高性能计算、团簇生长、能源材料等领域的分子动力学研究,受到了国内外科研人员诸多褒奖。

  另一项重点技术成果是“基于大数据的宏观经济分析”技术,它利用大数据收集、机器学习算法,收集规整“全样本个人”“全样本企业”和“典型区域”三大类数据,构建了用大数据分析宏观经济的知识图谱。成果发布人杨雨成表示,它是一套全新的方法论,为宏观研究与政策分析提供了系统性解决方案,打破了高度依赖加总统计数据的传统局限。

  张林峰、杨雨成是北京大数据研究院的实习研究员、普林斯顿大学的博士研究生,他们尽管很“年轻”,但已成为研究院重点项目的科研骨干。这得益于研究院的体制机制创新。

  据了解,三年前,中关村管委会、海淀区政府、北京大学、北京工业大学四方共同支持设立北京大数据研究院。三年来,研究院通过“大学+民非+企业”体制创新、“双聘制”机制创新和政府与社会资本合作(PPP)运营模式创新,吸引了一批国际大数据顶尖研发人才,孵化了墨奇科技、博雅大数据学院、品见智能等一批创新型企业,形成了多方协同推动科技成果转化及产业化的“北京模式”。通过支撑“大数据分析和应用技术国家工程实验室”和“工业大数据应用技术国家工程实验室”建设,参与“医疗大数据应用技术国家工程实验室”建设,勇挑国家大数据产业化重担,建立了大数据的“北京品牌”。

  “大数据落地是非常复杂的系统工程,投入大,回报周期长,需要打造一个‘尖刀队’来趟平一条路,大数据研究院目标之一就是成为这样的‘尖刀队’。”北京大数据研究院院长、中国科学院院士鄂维南介绍说,北京大数据研究院是核心技术攻关的先锋队,一项重要工作是把实际问题凝练成科研问题,集中攻关。

  如何建立高效的产学研协同创新机制?如何切实完成大数据落地这一复杂系统工程?鄂维南指出,门道在人工智能在科研的应用(AI for science)。大数据研究院通过创新科研方法和科研模式,全面推进以大数据为基础的科研基础设施建设,打造一个让年轻人充分发挥作用的平台。他介绍说,传统的科研“套路”中,从数据中总结规律的“开普勒范式”面临着“知其然而不知其所以然”的困难,寻求基本原理的“牛顿范式”却难以处理复杂问题。一方面,“机器学习+物理模型”有机结合,既能面对复杂问题,又不脱离基本原理,可以彻底改变科研创新的方法;另一方面,通过科研模式创新,降低门槛,把科研人员从繁重的体力劳动中解放出来,缩短实验室课题与实际应用难题的距离,让科研人员把经历聚焦在真正感兴趣的问题上,推动科研由“小农模式”向“大工业模式”演变。

  发布会上,“新一代指纹识别技术”作为一项企业孵化成果发布。北京大数据研究院研究员、普林斯顿大学博士、墨奇科技创始人邰骋表示,该技术解决方案在十亿级别的指纹比对上实现了实时高精度比对,是目前全球唯一能够实现指纹比对完全自动化的技术,被指纹专家称为“指纹技术的革命”。公安部第三研究所副所长李建瓴表示,这项技术已帮助全国刑侦人员破获了多起案件,成功应用在公安实践。

  科大讯飞、旋极信息、先进数通三家北京大数据研究院合作企业在发布会上分别发布了“讯飞交通超脑”“国家北斗网格码标准及成果”和“金融风控反欺诈”等成果,研究院产业化合作成效充分显现。

   中国科技网 作者杨扬