可适性视讯编码

科技工作者之家 2020-11-17

可适性视讯编码(Scalable Video Coding, SVC)是传统H.264/MPEG-4 AVC编码的改良,可提升更大的编码弹性,并具有时间可适性(Temporal Scalability)、空间可适性(Spatial Scalability)及讯杂比可适性(SNR Scalability)三大特性,使视讯传输更能适应在异质的网络带宽。

概述SVC的目标在于标准化已使编码的高质量的视频码流,可以独立拆分成一个或多个子比特流(subset bitstream)进行解码,可以自己用一个复杂和重建质量达到类似的利用现有的H.264/MPEG-4 AVC的设计与相同数量的数据码流中的一个子集。

一个子比特流(subset bitstream)可以代表一个空间或时间分辨率较低或质量较差的的视频信号(每个单独或组合)相比。

时间(帧速率)的可适性:由于一般视频压缩都会利用运动补偿的手段,纪录位移向量(motion vector)。在某些系统的应用上,可以跳过某几帧用其邻近帧的位移向量内插出该被跳过帧的结果。在解码端同样利用运动补偿算回该被跳过帧。

空间(图片大小)的可适性:图形(或视频压缩中的一帧)在压缩编码的时候即存下了多重大小(或分辨率)的结果。让解码端得以视需求解码回所需的图片大小(或分辨率),可能以较小的结果换取解码的效率。通常较小的图片即带有大图片一部分的特性,大图的存储上不需要重复记录这些重复的部分。

信噪比/质量/质量可适性:在压缩编码的时候将多重质量(qualities)的结果都存下来。让解码端得以视需求解码回所需的图片质量,可能以较低的质量换取解码的效率。通常质量较差的图片仍有一定的代表性,质量较佳的结果在存储上不需要重复记录重复的信息。

联合可适性(Combined scalability):结合上述三个扩展性。1

例子空间可适性与质量可适性的综合应用可以参考JPEG 2000视频压缩。JPEG 2000从递进性(Progressive)与可适性(Scaling)两个角度来看待:

从递进性的角度来看,解码的过程会先去截取前端低分辨率信息,先解得低分辨率图片;再一步步截取更多信息,逐步增进分辨率。这代表了用户可以视需求只解码部分而得到缩略图,节省计算量。

从可适性的角度来看,其编码内容可以在任意位置截断,从头至此的编码片段可被解码回一张较低分辨率的图片。编码片段越长,解码后的分辨率越高(或说放大到同样分辨率时,其峰值信噪比(PSNR)较佳)。这意味了当需要更高压缩率时,直接丢弃后方的编码数据即可达成。2

里程碑2003年10月,Moving Picture Experts Group(MPEG)提出SVC Technology的提议

2004年4月: 第14版提议出炉

规范Scalable Baseline Profile

支持B frame,加权预测的CABAC熵编码法,以及8 × 8亮度变换在增强层,虽然基础层(base layer)要匹配有限制baseline。

质量和时间(Quality and temporal)可扩展编码的支持不受任何限制。

Scalable High Profile

Scalable High Intra Profile1

本词条内容贡献者为:

曹慧慧 - 副教授 - 中国矿业大学

科技工作者之家

科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。