本发明实施例提供一种音字转换方法和系统,所述方法包括:整句生成步骤,按照拼音切分路径权重计算规则,对以当前字符结尾的拼音流的所有拼音切分路径排序,选择所述所有拼音切分路径中权重值最高的第一预定数量的拼音切分路径进行整句生成;Unigram出词步骤,对所述以当前字符结尾的拼音流的所有拼音切分路径进行Unigram出词;处理步骤,将所述整句生成结果和所述Unigram出词结果进行去重和排序,获得所述以当前字符结尾的拼音流的音字转换结果.通过本实施例的方法和系统,实现了拼音到汉字的转换,通过将可能的整句或词组或汉字候选去重后按一定顺序排序,提高了整句生成效率.
发明专利
CN201110187942.1
2011.07.06
CN102866781A
2013-01-09
关毅 阎于闻
哈尔滨工业大学
G06F3/023(2006.01)I,G,G06,G06F,G06F3
G06F3/023(2006.01)I,G,G06,G06F,G06F3,G06F3/023
一种音字转换方法,其特征在于,所述方法包括:整句生成步骤,按照拼音切分路径权重计算规则,对以当前字符结尾的拼音流的所有拼音切分路径排序,选择所述所有拼音切分路径中权重值最高的第一预定数量的拼音切分路径进行整句生成;Unigram出词步骤,对所述以当前字符结尾的拼音流的所有拼音切分路径进行Unigram出词;处理步骤,将所述整句生成结果和所述Unigram出词结果进行去重和排序,获得所述以当前字符结尾的拼音流的音字转换结果.