浙大团队发表3D视图合成新方法,效果远超NeRF、NV

科技工作者之家 2021-01-09

来源:大数据文摘

观众可以切换任意视角,不再局限于导播镜头

这种视频到底怎么才能拍出来?一般来说,传统的方法是,需要好多台摄像机从不同角度一起拍,然后把所有角度的视频合成在一起。

NeRF、NV与新方法效果对比,前两者均出现失真、变形等问题

因此,为了解决这个不适定问题,来自浙大、港中文和康奈尔大学的研究团队,提出在视频帧上整合观察结果的关键思想。

团队的最新研究成果中,提出了Neural Body。这是一种新的人体表示,它假设在不同帧上学习到的神经表示共享,锚定在一个可变形网格上的相同的潜码集,以便跨帧的观察可以自然地集成。可变形网格也为网络提供了几何指导,以更有效地学习3D表示。

20210109161940_c6b0ca.jpg

Neural Body的基本思想

研究人员在一个新收集的多视图数据集上进行了实验,结果表明,该方法在视图合成质量方面,与之前的方法相比,具有很大的优势。

团队在demo演示中,展示了其方法从做出各种动作的人物的单目视频中,重建移动的人物的能力。

20210109161941_d56610.jpg

从4个角度的视频图像中,得到自由视角视频结果

这一方法大大降低了自由视角视频合成的成本,至少,省下了摄像机的成本,因此也具有更广泛的适用性。

Neural Body,分五步走

一、结构化的潜码 

为了控制潜码的空间位置与人体姿态,团队将这些潜码锚定到一个可变形人体模型(SMPL)。SMPL 是一个基于皮肤顶点的模型,它被定义为形状参数、姿势参数和相对于 SMPL 坐标系的刚体变换函数。

潜码与神经网络,一起用于表示人的局部几何和外观。将这些代码锚定在一个可变形的模型上,能够表示一个动态的人。通过动态人的表示,团队建立了一个潜在变量模型,将同一组潜码映射到不同帧的密度和颜色的隐式域中,自然地整合了观察结果。

二、代码扩散 

由于结构化的潜码在三维空间中比较稀疏,直接对潜码进行插值会导致大多数三维点的向量为零。为了解决这个问题,团队将表面上定义的潜码扩散到附近的三维空间。

由于代码的扩散不应该受到人在世界坐标系中的位置和方向的影响,他们将代码的位置转换为SMPL坐标系。

代码扩散还将结构化潜码的全局和局部信息集合起来,有助于学习隐式域。

三、密度和颜色回归 

20210109161942_e77614.jpg

图(b)概述了三维空间中任意点的密度和颜色的回归

研究团队发现,时间变化因素会影响人体的外观,如二次照明和自阴影。受自动解码器的启发,团队为每个视频帧分配了一个潜在的嵌入框架t,以编码时间变化的因素。

四、体绘制 

在给定的视点下,团队利用经典的体绘制(volume rendering,也称立体渲染)技术,将Neural Body渲染成二维图像。

然后,基于SMPL模型估计场景边界,接着,Neural Body会预测这些点的体积密度和颜色。

在体绘制的基础上,通过对渲染图像和观测图像的比较,对模型进行了优化。

五、训练 

与基于帧的重建方法相比,该方法利用视频中的所有图像来优化模型,并拥有更多的信息来恢复3D结构。

此外,团队采用Adam优化器来训练Neural Body。训练在四个2080TiGPU上进行。对于一个共300帧的四视图视频,训练通常需要大约14小时。

经过以上五个步骤,Neural Body得以实现基于少量视图的自由视角视频合成,而且与其他方法对比,效果明显优于前者。

20210109161942_eead31.jpg

三种方法输出结果的 PSNR(峰值信噪比)对比,数值越大,表明输出图像质量越好。注:「OURS*」 和「OURS」分别代表只在一帧视频和在四帧视频训练的结果)

AI的脑补技术,让3D效果的实现越来越简便,而它的应用也不止是影视业与体育赛事直播领域,对于游戏开发者、健身指导、3D广告提供商等来说,都是能够大大提升工作效率与效果的工具。

20210109161943_f656d2.jpg

未来的影院、赛场,可能人手一部 iPad,想看哪里点哪里。

来源:BigDataDigest 大数据文摘

原文链接:http://mp.weixin.qq.com/s?__biz=MjM5MTQzNzU2NA==&mid=2651694210&idx=1&sn=1ac37bf5db4ec2f046843033aaef66e3

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

图像 3D NeuralBody

推荐资讯