科技工作者之家
科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。
科技工作者之家 2020-07-20
来源:中科院之声
在复杂的声学应用场景中,语音信号易受到环境噪声与房间混响的影响,给自动语音识别和语音通信带来较大的干扰。尽管目前基于深度学习的单通道语音增强方法可有效抑制干扰成分,但这些方法的网络参数量较大且运算复杂度较高,难以应用于低功耗设备。
对此,中国科学院声学研究所噪声与振动重点实验室研究生李安冬、研究员郑成诗等,提出一种基于卷积循环的单通道渐进语音增强方法,在保持增强性能不变的前提下,减小了参数量并降低了运算复杂度。相关研究成果线发表在 Applied Acoustics 上。
研究人员在卷积循环神经网络基础上将增强过程分解为多个子阶段,在每个子阶段中进行轻量级模块建模并提升一部分语音的信噪比,从而在后续阶段中能够把之前阶段的输出作为先验信息,逐步提升后续处理结果。同时通过在不同阶段复用LSTM(Long and Short-Term Memory)模块的方式减小参数量。
实验结果表明,在仅采用3个阶段的情况下便可以达到和原有复杂卷积循环神经网络模型相近的性能。随着阶段数的增加,性能则会进一步提升。这种增强方法可用于低功耗设备上的噪声抑制与语音信息恢复。
研究工作得到国家自然科学基金的资助。
算法系统框图(图/声学所)
来源:zkyzswx 中科院之声
原文链接:https://mp.weixin.qq.com/s?__biz=MjM5NzIyNDI1Mw==&mid=2651776396&idx=3&sn=ae64ce4d0134b2956c77b211e64f66f3&chksm=bd270fde8a5086c819dbd778ab2d8ea74e513eca53f784b577640edc6faa585177ae387300b0#rd
版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。
电话:(010)86409582
邮箱:kejie@scimall.org.cn
【干货】机器学习必知的八大神经网络架构
如何入手卷积神经网络
脑网络组研究中心提出基于脑功能影像时间序列的多尺度卷积循环神经网络模型
自动化所提出基于脑功能影像时间序列的多尺度卷积循环神经网络模型
【论文精选】采用卷积神经网络构建西北太平洋柔鱼渔场预报模型
CICC科普栏目|一图抵千言:带你了解最直观的神经网络架构可视化
图解丨卷积神经网络数学原理解析
自动化所提出神经元群体间侧向交互的卷积脉冲神经网络模型
后ResNet时代:SENet与SKNet
【论文精选】基于级联卷积神经网络的番茄花期识别检测方法