科技工作者之家
科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。
科技工作者之家 2019-10-16
来源:中国高科技
由于语音通常受到背景噪声和环境干扰的影响,语音增强技术在过去几十年中深受关注。近年来,基于深度学习的语音增强方法在应对非平稳噪声方面表现突出,并可显著提高语音的可懂度。对双耳听力的研究表明,保留语音中的空间信息有助于人耳对噪声环境中语音的理解,然而,大部分语音增强方法的目标为单通道语音信号,不能保留原有的空间信息。
对此,中科院语言声学与内容理解重点实验室的孙兴伟与其导师李军锋研究员等人研究语音增强方法以及双耳信号空间信息保持,提出一种基于深度学习的保持空间信息的双耳语音增强方法,在语音增强的同时保留其空间信息,有助于提高人耳对语音的理解能力。
相关研究成果2019年5月发表于国际学术会议 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2019)。
本研究将双耳信号的左右通道组合为一个复数信号,将一个双通道增强问题转换为一个在复数域处理的单通道增强问题。随后研究人员提出一种复数域时频掩蔽方法,并训练一个复数神经网络对其进行估计,最终应用于单通道复数信号进行语音增强并重建双耳信号。
实验结果表明,基于复数神经网络的双耳语音增强方法将语音信号的信噪比提升超过10dB,并且能够保持语音原有的空间信息。
此双耳语音增强方法可应用于助听器等设备,帮助人耳理解语音。
▲ 算法系统框图(图/中科院声学所)
本研究得到了国家自然科学基金(No.11590770-4, No.11722437, No.61650202, No.U1536117, No.61671442, No.11674352, No.11504406, No.61601453), 国家重点研发计划(2016YFB0801203, 2016YFC0800503, 2017YFB1002803) 和 新疆维吾尔自治区重大科技专项(2016A03007-1)资助。
参考文献:
SUN Xingwei, XIA Risheng, LI Junfeng, YAN Yonghong. A Deep Learning Based Binaural Speech Enhancement Approach with Spatial Cues Preservation. ICASSP 2019, pp.5766-5770. DOI: 10.1109/ICASSP.2019.8683589
论文链接:
https://ieeexplore.ieee.org/document/8683589
来源:cas-hitech 中国高科技
原文链接:http://mp.weixin.qq.com/s?__biz=MzA3MDczMTAzMA==&mid=2650047479&idx=4&sn=27ef129d6c38319a3d281531e909a525&chksm=8738778eb04ffe98cf23810e231dd778ead4daeb067a6f6eda11f0661e943d338a2ee76b6d74&scene=27#wechat_redirect
版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。
电话:(010)86409582
邮箱:kejie@scimall.org.cn
【深度】基于深度学习的行人重识别研究进展
用高中数学理解 AI “深度学习”的基本原理
深度学习算法“解密”脑活动
深度学习框架
AI芯片设计难?厂商要给软件开发者降低门槛
深度学习算法准确追踪动物运动
动物所构建深度学习模型
图灵奖后,深度学习呼唤深度理解
【深度】 基于深度强化学习的未知环境自主探索方法
个性化深度学习机器人帮助治疗自闭症