融合段长信息的中、英文语种辨识  

Language Identification between Mandarin and English with State Duration Information

在线阅读下载全文

作  者:孙健[1] 王作英[1] 

机构地区:[1]清华大学电子工程系,北京100084

出  处:《模式识别与人工智能》2006年第5期567-571,共5页Pattern Recognition and Artificial Intelligence

基  金:国家863计划资助项目(No.2001AA114071)

摘  要:状态的段长信息反映语言发音变化速率的信息.不同语言的发音速率也存在着差异,因此状态的段长信息可以作为区分语种的信息之一.本文在建立基于段长分布的隐含 Markov 模型(DDBHMM)的音素识别系统和大词汇量连续语音识别(LVCSR)系统的基础上进行中、英文语种辨识,表明DDBHMM可以准确描述状态的段长信息,改善中、英文语种的辨识性能.Different languages have different pronunciation rates , so the state duration reflects the pronunciation rate of a language. The phone recognition system and LVCSR (Large Vocabulary Continuous Speech Recognition) system are developed by using DDBHMM (Duration Distribution Based Hidden Markov Model ) . Both systems are used to identify Mandarin and English . The results prove that DDBHMM describes the state duration accurately and improves the performance of language identification.

关 键 词:语种辨识 基于段长分布的隐含Markov模型(DDBHMM) Gauss混合模型 连续音素识别 大词汇量连续语音识别(LVCSR) 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象