• 基于LSTM循环神经网络的基频提取模型及训练方法

    • 摘要:

      本发明公开了基于LSTM(长短时记忆)循环神经网络的基频提取模型及训练方法.所述训练方法包括下述步骤:从语音波形信号中抽取声学特征;采用多任务学习的双向长短时记忆循环神经网络,通过所述声学特征,训练生成基于多任务学习的双向长短时记忆循环神经网络的基频提取模型.所述基频提取模型通过本发明的方法训练得到.本发明大大提高了基频提取的精度和鲁棒性,特别是很好地解决了基提取中的半倍频现象,能够在语音分离、语音合成等领域起到很好的作用.

    • 专利类型:

      发明专利

    • 申请/专利号:

      CN201611030326.4

    • 申请日期:

      2016.11.16

    • 公开/公告号:

      CN106653056A

    • 公开/公告日:

      2017-05-10

    • 发明人:

      陶建华 郑艺斌 温正棋 刘斌

    • 申请人:

      中国科学院自动化研究所

    • 主分类号:

      G10L25/30(2013.01)I,G,G10,G10L,G10L25

    • 分类号:

      G10L25/30(2013.01)I,G,G10,G10L,G10L25,G10L25/30

    • 主权项:

      一种基于LSTM循环神经网络的基频提取模型的训练方法,其特征在于,所述方法包括下述步骤:从语音波形信号中抽取声学特征;采用多任务学习的双向长短时记忆循环神经网络,通过所述声学特征,训练生成基于多任务学习的双向长短时记忆循环神经网络的基频提取模型.