检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]清华大学,北京100084
出 处:《计算机工程与设计》2007年第8期1931-1933,共3页Computer Engineering and Design
基 金:国家863高技术研究发展计划基金项目(2001AA114071)
摘 要:为了在未知一段语音所属语言种类的情况下将其转换为正确的字符序列,将语种辨识(language identification,LID)同语音识别集成在一起建立了中、英文大词汇量连续语音识别(large vocabulary continuous speech recognition,LVCSR)系统。为了在中、英文连续语音识别系统中能够尽早的对语音所属的语言种类做出判决以便进行识别,从而降低解码的计算量,对语种辨识过程中的语种剪枝进行了研究,表明采用合理的语种剪枝门限在不降低系统性能的情况下,可以有效的降低系统的计算量及识别时间。In order to transfer the speech into the correspond text without knowing the language, the language identification (LID) is integrated into speech recognition and then the large vocabulary continuous speech recognition (LVCSR) system is developed which support English and mandarin. The language pruning during the LID is discussed for making decision which language the sp6ech belong to early, then the speech can be recognized and the calculation is reduced in decoding. The experiments show that, if the pruning threshold is set reasonable, it could decrease the calculation, and so the system output the recognition result more quickly without losing the performance.
关 键 词:连续语音识别 语种辨识 段长分布 非齐次隐含马尔科夫模型 语种剪枝
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.81