汉语语音识别中融合发音信息的随机段模型研究  被引量:1

Integrating articulatory information into stochastic segment models for continuous Mandarin speech recognition

在线阅读下载全文

作  者:晁浩[1] 杨占磊[2] 刘文举[2] 

机构地区:[1]河南理工大学计算机科学与技术学院,河南焦作454000 [2]中国科学院自动化研究所模式识别国家重点实验室,北京100190

出  处:《计算机应用研究》2014年第11期3365-3368,共4页Application Research of Computers

基  金:国家自然科学基金资助项目(91120303;90820303;90820011);河南省基础与前沿技术研究计划资助项目(132300410332)

摘  要:提出了一种基于随机段模型的发音信息集成方法。根据随机段模型的模型特性,建立了阶层式人工神经网络来获取语音段信号属于各类音素的后验概率,并通过一遍解码的方式集成到随机段模型系统中。在"863-test"测试集上进行的汉语连续语音识别实验显示汉语字的相对错误率下降了5.93%。实验结果表明了将发音信息应用到随机段模型的可行性。This paper proposed a framework which attempted to incorporate articulatory information into the stochastic segment model based on Mandarin speech recognition system.According to the characteristics of the stochastic segment model,it used hierarchical artificial neural network to obtain the posterior probability of speech signal belonging to the phonemes.Then,it integrated the posterior probability into the stochastic segment model system in the first search process.Experiments conducted on “863-test”set show that about 5 .93% relative improvement could be achieved in the recognition accuracy.Thus,it de-monstrates the feasibility of the method.

关 键 词:语音识别 随机段模型 发音信息 阶层式人工神经网路 发音特征 

分 类 号:TP391.42[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象