自适应多速率音频压缩

科技工作者之家 2020-11-17

自适应多速率音频压缩Adaptive multi-Rate compression,简称AMR)是一个使语音编码最优化的专利。AMR被标准语音编码 3GPP在1998年10月选用,当前广泛在GSM和UMTS中使用。它使用1-8个不同的位元率编码。

简介AMR也是使用AMR编解码器存储语音音频的文件格式。 许多现代移动电话手机可以存储AMR格式的短录音,并且存在免费和专有程序(请参阅软件支持)以在此格式和其他格式之间进行转换,尽管AMR是一种语音格式,并且不太可能为其他格式提供理想的结果音频。 常用文件扩展名为.amr。 AMR还存在另一种存储格式,适用于对存储格式有更高级要求的应用,如随机访问或与视频同步。 此格式是基于ISO基础媒体文件格式的3GPP指定的3GP容器格式。1

使用为保证每20毫秒160采样点的采样率,AMR使用ACELP、DTX、VAD和CNG等不同的技术,从中选择最好的编码模式适应局部信道和通路频带要求。如果广播条件差,源编码减少,信道编码增加。此举可提高网络连接的品质,但必须牺牲语音的清晰度。在特别情况下AMR 增加大约S/N = 4-6 dB。

图一列出共计14种方式的AMR编码,包含8个全频(FR)和6个半频(HR)。

特点采样率 8 kHz/13-bit (160 采样点每20ms),滤波后只保留 200-3400 Hz 范围内的信号。

编码器使用8个位速:12.2、10.2、7.95、7.40、6.70、5.90、5.15和4.75 kbit/s。

生成的帧长度为95、103、118、134、148、159、204或244bit,对应的位速分别为4.75、5.15、5.90、6.70、7.40、7.95、10.2或12.2 kbit/s。

AMR利用 Discontinuous Transmission (DTX), Voice Activity Detection (VAD)和Comfort Noise Generation (CNG)减少在无声时候的带宽。

算法延迟是每帧20ms。位速是12.2的时候,没有前瞻延迟。其他速率的前瞻延迟是5 ms. 注有5 ms 的仿前瞻延迟,允许准确的帧宽模式转换其余速率。

AMR是使用 Algebraic Code Excited Linear Prediction (ACELP)的混合语言编码器。

运算法则的复杂性是5的话,则G.711是1G.729a是15。

PSQM在理想条件下测试失真Mean Opinion Scores AMR(12.2 kbit/s)是 4.14,相比G.711(u-law) 是 4.45。

PSQM在网络条件下Mean Opinion Scores AMR(12.2 kbit/s)是3.79,相比G.711(u-law) 是4.13。

专利许可AMR编解码器包含诺基亚,Ericssion,NTT和VoiceAge的多项专利,最后一项是AMR专利池的License Administrator。 VoiceAge还接受提交专利以确定其对这些标准的可能必要性。然而,由于发明人(及其律师)竭尽所能隐藏与AMR/AMR相关的专利,因此很难确定是否存在与AMR/AMR-WB编解码器相关的所谓发明的专利WB技术。显然,所有这些专利都隐藏在所有其他研究和普通观众中,这些研究和普通观众可能在AMR/AMR-WB编解码器的专利持有者所申请的专利权利要求中发现现有技术。

专业内容创建工具和“实时频道”产品的初始费用为6,500美元。最低年度特权使用费为10,000美元,在第一年不包括初始费用。每通道许可证费用从0.99美元降至0.50美元,每年最高可达200万美元。

在个人计算机产品类别中,例如媒体播放器,AMR解码器是免费许可的。销售编码器的许可证费用从0.40美元到0.30美元不等,每年最高可达30万美元。最低年度版税不适用于属于个人计算机产品类别并仅使用免费解码器的许可产品。

AMR编解码器数个专利:

VoiceAge licensing information,包含编解码器价格.

3GPP legal issues

The 3G Patent Platform and its licensing policy

AMR Codecs as Shared Libraries - amrnb 和 amrwb 开发站点,共享库。

本词条内容贡献者为:

何星 - 副教授 - 上海交通大学

科技工作者之家

科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。