点击蓝字
关注我们
三维视频智能编码基础理论与方法
元 辉
图像视频编码研究视觉信号在率失真准则下的最优表示,是可视媒体计算、存储、传输的核心,已成为数字媒体通信、公共安防等国家重大应用的共性基础,也是工信部、国家广电总局、中央广播电视总台联合印发的《超高清视频产业发展行动计划》中提出的重点、核心任务之一。传统单目视频中用户的观看内容由摄像机的空间位置决定,用户不能自由地选择观看视角,也无法体验到真实的三维场景。而三维视频则可以依据用户需求通过内容渲染或视点合成技术使用户观看到场景中任意视点的三维信息,能够为用户提供“身临其境”的视觉感知,是虚拟/增强现实的内容基础之一,是人类长期追求的视觉体验目标,也是科学界、工业界的研究热点。相比单目视频,三维视频数据量巨大。三维视频一般采用多视点纹理和深度视频表示。用户可依据观看视角,采用虚拟视点合成技术构建任意视点的视频。由于合成的虚拟视点质量较低,严重限制了三维视频的应用。在国际标准组织MPEG确定的三维视频编码工具范围内,如何突破虚拟视点质量的限制,揭示三维视频特有的率失真特性,解决三维视频的率失真优化编码问题,大幅度提高三维视频的编码效率,是长期困扰国内外学术届的难题。
本项目在国家自然科学基金委和山东省自然科学基金委的支持下,历经长期深入的研究,揭示了三维视频的率失真特性,实现了虚拟视点的失真建模,开辟了三维视频智能优化编码的理论途径,对三维视频编码理论与方法做出了创新性贡献,促进了相关学科的发展。代表性成果得到国内外多个著名研究团队的正面评价,已成为相关研究领域的“基准方法”。获得相关发明专利授权8项。因在三维视频编码方面的贡献,项目完成人2012年入选了人社部第二届“香江学者”计划,2016年获得了山东省自然科学杰出青年基金的资助。