“亦庄贡献”!全球首个车路协同自动驾驶数据集正式发布

黄玉林 2022-03-01

人工智能见多识广才能越用越聪明,如何丰富人工智能的“见识”?数据!

  2月24日,全球首个基于真实场景的车路协同自动驾驶数据集正式发布,向境内用户提供下载使用。

该数据集由清华大学智能产业研究院(AIR)联合北京市高级别自动驾驶示范区、北京车网科技发展有限公司、百度Apollo、北京智源人工智能研究院共同发布。此次发布的数据集,首次实现在同一时间、空间下,车端、路端数据的2D、3D标注方法创新,作为业界、学界首个开源车路协同自动驾驶数据集,将有效服务科研、产业、政府机构,有效协同各方进行车路协同研究、产业落地和市政规划建设,促进我国车路协同发展。北京经开区管委会副主任、北京市高级别自动驾驶示范区工作办公室主任孔磊参加发布会。

  道路测试可以支撑企业加速算法和产品的迭代升级,收集大量数据,促进自动驾驶行业快速发展。过去一年里,以北京经开区为核心建设的北京市高级别自动驾驶示范区(以下简称“示范区”)依托政策先试先行优势,面向自动驾驶企业率先开放了部分城市道路、高速公路道路场景,每有新的道路场景开放,企业方都会提到数据收集对于技术迭代至关重要的作用。在“单车智能+车路协同”的中国特色自动驾驶路线中,车路协同是各界研究重点。而高质量数据是车路协同自动驾驶技术的关键,能够持续优化自动驾驶算法,助力自动驾驶系统迭代升级,为高级别自动驾驶的大规模推广做好安全保障。然而,当前高校、科研院所、产业用户均面临着相关数据集缺乏的问题,怎么办?为此,清华大学智能产业研究院(AIR)发起数据集建设,以更好地支撑科研机构进行科学研究,同时示范区真实的数据采集、多样的场景覆盖、海量的数据样本,也可以解决企业在产品开发中的切实需求。

那么,数据来源于哪里?实际上,示范区启动建设以来,就在北京经开区开展了智能网联基础设施建设。目前1.0阶段已完成总长12.1公里城市道路+10公里高速道路的智能网联基础设施建设;2.0阶段建设围绕北京经开区核心区60平方公里、共计305个路口实现智能网联道路基础设施全覆盖,目前已完成基础建设和设备安装,正在进行联调联试和功能优化。此次发布的数据集正是基于示范区智能网联设施收集整理形成的。据介绍,数据集的数据来自示范区10公里真实城市道路、10公里高速公路以及28个路口范围,包含来自车端、路端相机和车端、路端激光雷达等多类型传感器的72890帧图像数据和72890帧点云数据,涵盖晴天、雨天、雾天,白天和夜晚,城市道路与高速公路等丰富场景。与仅包含单车端或路端的数据集相比,该数据集首次克服了以往车路协同在同一时空检测但数据不同步的难题,将车上和路上的信号同步标注,使数据更精确地服务车路协同。此外,数据集通过3D标注方法等创新,将提升算法在测试集上的3D目标检测精度、降低路端数据使用量,以减少通信时延、减少传感器使用量,从而节省成本、降低能耗。示范区建设为自动驾驶技术研发科研机构、科技企业打造试验技术沙盒,并提供政策、法规、技术规范支持,带来海量、多模态、多视角的真实场景数据,对数据进行标注、脱敏和安全加密等处理后发布,促进学术界和产业界共同打造数据驱动的车路协同自动驾驶。孔磊表示:“未来将及时利用数据转化制定一批车路协同数据标准,推动行业数据要素、接口、格式等标准统一,为示范区建设和行业发展提供参考和指导;通过数据开放,为高校和科研机构提供基础数据,为企业产品研发测试提供支持,有效加速产学研用协同,同时继续开展数据开放和共享服务模式探索,推动数字经济发展。