俄罗斯世界杯激战正酣,无论是通过电视或是手机,球迷朋友们都可以随时欣赏精彩的比赛。央视音频在本次世界杯的转播中承担着众多任务,其中包括有俄罗斯前方IBC和演播室音频制作、后方直播演播室音频制作、手机APP直播三维声音频制作等各项工作。此外,还有一项相对神秘的工作,正在紧锣密鼓地进行中……
利用本届世界杯的契机,三维声标准工作组在光华路办公区后期一科音频岛机房搭建了三维声制作环境和家庭终端接收环境,对目前采用Auro Renderer & Fraunhofer MPEG-H的渲染和编解码技术的行业标准进行验证性测试工作。此次实际是HDR和三维声两个标准工作组进行联合测试,系统包含主控前端、制作端、家庭终端全链路,合作方涉及捷成/Auro、Fraunhofer IIS、Junger、KuVision柯维新、Hisilicon海思、Skyworth创维等多家公司。本次测试对于推进三维声行标的建立,以至于未来向广大电视用户传输三维声信号,有着重要的意义。
由于本次世界杯主转播商向持权转播商提供全部64场赛事的三维声信号,而在中国CCTV则是拿到了世界杯的独家版权,因此要想听到通过多音箱还放的世界杯三维声信号,目前只能在CCTV的机房中才可以实现。不过大家也不要感到遗憾,毕竟本次测试的目的,就是为了未来能将三维声推广到千家万户中。那么接下来,就让我们走进本次测试工作所涉及的各个机房,去一探其中的究竟。
三维声信号制作环境
家庭终端接收环境
为了让大家能看得更加通俗易懂,下面让我们配合世界杯的氛围,把整个三维声系统用足球比赛的方式来进行讲解:
首先是制作端,涉及到本次测试的前端部分,主要需要完成的工作是元数据的生成和仿真监听。假如以足球类比的话,制作端相当于训练场,主控送来的16声道声音信号(具体16声道信号内容请参见上期苑老师写的部分)就相当于是参与训练的球员,元数据相当于是各种战术。我们在制作端将16声道信号进行重新排布,并为其配置元数据,相当于根据球员的不同特点进行不同的战术配置。例如稳守反击(只有声床信号+解说)、两翼齐飞(加入Fan Corner信号增加氛围)、长传冲吊(在上层声道加入PA音效增强沉浸感)等不同战术,其中部分战术还涉及到更精细的配置,像稳守反击时是否同时只有一个中卫参与反击(中英文解说加入Switch Group,同时只能选择一种解说)。总之各种复杂的元数据被配置上,只为应对不同的需求。
Junger C8000处理器 及 MMA主机
Junger MMA元数据配置界面
而前端所做的另一个工作是仿真监听,有了球员和战术,我们还要在制作端实时检验下战术是否能被有效地执行,比如万一操作失误,两个中卫都插上进攻(中英文解说同时出声),岂不是阵型漏洞百出。因此,我们利用仿真监听,在制作端就可以听到最终元数据指导音频进行渲染后的各种不同结果,使得我们在训练时就对最终的战术效果做到胸有成竹。另外我们还将各种仿真监听信号录入Pro Tools中,以便未来做对比分析。本次由于是使用Fraunhofer的技术和Junger的设备来完成前端的各项工作,我们还专程请来德国教练……不,是德国技术专家来进行现场支持,保证了整个工作过程的顺利。
与Fraunhofer和Junger德国技术专家讨论工作
制作端使用工作站进行信号收录
我们在前端将配置完成的元数据与音频一起打包,加嵌后回传给主控。主控将我们的音频信号和元数据解嵌,再与超高清视频信号合并加嵌后,共同送入柯维新编码器做视频和音频的编码,之后将编码信号传到末端的千家万户的机顶盒中……抱歉又穿越了,千家万户的机顶盒是未来的目标,而本次的测试,则是将编码信号传回到了我们搭建的家庭终端接收环境。
家庭终端的三维声还放
战术配置和演练那么久,为的就是能在球场上实践,而终端环境就是我们本次的最终赛场。我们的球员和战术板经过编码和传输的过程后,最终传递到了终端临场教练——创维机顶盒手中。什么?你问为啥中国教练能够读懂外国的战术板?因为与创维教练紧密团结在一起的海思芯片助理教练早已经过培训,可以读懂MPEG-H编码,并进行解码,将战术应用于实践。不过时间紧任务急,海思教练只能读懂最基础的战术(立体声下混),其他更复杂的战术还是由配置在终端的Fraunhofer AVR功放来解码,并运用内置的MPEG-H渲染技术+ Auro的对象渲染技术,用元数据指导声音进行渲染,在终端实现三维声的重放。这其中除了完成三维声的重放,还加入了用户交互的内容。换句话说,相当于给每个用户都发了一块战术板。
举个例子:
观众A:我想看比赛,听解说,就像以前一样;
请选择战术1,一切都是熟悉的配方,只是比赛变成了三维声,稳守反击;
观众B:我想比赛的气氛能更热烈,听到更多现场球迷的呐喊;
请选择战术2,FanCorner效果两翼齐飞,让你在家中被球迷们包围;
观众C:我想沉浸感再强一点,感觉我家就是个体育场;
请选择战术3,PA的声音由上层音箱长传冲吊进入你的耳朵里;
观众D:什么都好,但我不想听解说了,太乱;
请选择战术4,中卫不再盲目插上了,进攻不怕被打反击,踏实多了;
观众E:I want tohear theEnglish Commentary!
Please choose EnglishCommentary in Switch Group,换个外援来!
用户交互界面
诸如以上的各种战术还有很多,更关键的一点,这些都是可以被用户实时控制的,例如解说听英文还是中文,音量大一些或小一些,Fan Corner效果声的位置等等,总之一句话,用户就是主教练,所有声音就是球员,怎么踢,听你的。
怎么样,听完上面的介绍,你是不是已经迫不及待主导一场比赛了?能够让更多用户在未来可以在家看电视时,欣赏到三维声,并掌控各种声音的比例,就是我们工作的最终目的。为了这个目标,我们配合俄罗斯世界杯,从5月21日起开始搭建音频岛测试环境,到5月底在基础资源部同事的大力协助下打通主控与音频岛之间的系统链路,再到6月初更新Junger MMA设备,在其中实现Auro与Fraunhofer的技术握手,到6月6日接收到俄罗斯世界杯前方回传的信号,每一个环节,我们与技术人员充分沟通、紧密配合,研发、测试、分析、调改、再测试……工作组成员日以继夜,最终保证在世界杯开幕前实现了全链路调通。
此外,音频后期一科在世界杯期间还承担了《豪门盛宴》节目的后期音频处理工作,协助4K制作岛对剪辑后的用于重播的节目环绕声音频进行编码,使广大观众在第二天一早就能在歌华有线央视4K专区点播前一天晚上的《豪门盛宴》,看到比直播的高清信号更加夺人眼球的超高清节目画面。如果你由于各种原因无法熬夜看球,那么就让央视专区一早上架的前一晚《豪门盛宴》作你回看比赛前的开胃早餐吧。