• 基于汉语韵律结构和重音的联合预测模型构建方法及系统

    • 摘要:

      本发明涉及一种基于汉语韵律结构和重音的联合的预测模型构建方法及系统,所述构建方法包括:对多个历史语料文本训练语料进行预处理,得到预处理文本;对预处理文本进行分词处理,得到分词文本信息;根据分词文本信息确定对应文本的词向量特征序列;基于注意力机制的RNN的编码‑解码,对所述词向量特征序列进行编码、解码处理,建立基于汉语韵律结构和重音的联合预测模型,用于预测待处理文本的韵律结构和重音.本发明通过对多个历史语料文本训练语料进行预处理、分词处理获得分词文本信息,得到对应文本的词向量特征序列,进而基于注意力机制的RNN的编码‑解码,建立联合预测模型,充分考虑汉语韵律结构与重音的关系,实现对待测文本的准确预测.

    • 专利类型:

      发明专利

    • 申请/专利号:

      CN201710561567.X

    • 申请日期:

      2017.07.11

    • 公开/公告号:

      CN107464559A

    • 公开/公告日:

      2017-12-12

    • 发明人:

      陶建华 郑艺斌 李雅

    • 申请人:

      中国科学院自动化研究所

    • 主分类号:

      G10L15/18(2013.01)I,G,G10,G10L,G10L15

    • 分类号:

      G10L15/18(2013.01)I,G10L15/16(2006.01)I,G10L15/14(2006.01)I,G06F17/27(2006.01)I,G,G10,G06,G10L,G06F,G10L15,G06F17,G10L15/18,G10L15/16,G10L15/14,G06F17/27

    • 主权项:

      一种基于汉语韵律结构和重音的联合预测模型构建方法,其特征在于,所述构建方法包括:对多个训练语料进行预处理,得到预处理文本;对所述预处理文本进行分词处理,得到分词文本信息;根据所述分词文本信息确定对应文本的词向量特征序列;基于注意力机制的循环神经网络RNN的编码‑解码,对所述词向量特征序列进行编码、解码处理,建立基于汉语韵律结构和重音的联合的预测模型,用于预测待处理文本的韵律结构和重音.