基于最大似然线性回归的随机段模型说话人自适应研究  

Research of speaker adaptation of stochastic segment models using maximum likelihood linear regression

在线阅读下载全文

作  者:晁浩[1,2] 杨占磊[2] 刘文举[2] 

机构地区:[1]河南理工大学计算机科学与技术学院,河南焦作454000 [2]中国科学院自动化研究所模式识别国家重点实验室,北京100190

出  处:《计算机工程与科学》2014年第8期1604-1608,共5页Computer Engineering & Science

基  金:国家自然科学基金资助项目(91120303;90820303;90820011);国家973计划资助项目(2004CB318105);国家863计划资助项目(20060101Z4073;2006AA01Z194)

摘  要:提出了一种随机段模型系统的说话人自适应方法。根据随机段模型的模型特性,将最大似然线性回归方法引入到随机段模型系统中。在"863-test"测试集上进行的汉语连续语音识别实验显示,在不同的解码速度下,说话人自适应后汉字错误率均有明显的下降。实验结果表明,最大似然线性回归方法在随机段模型系统中同样能取得较好的效果。A speaker adaptation method of Stochastic Segment Model (SSM) is proposed.According to the SSM's characteristics,the theory of Maximum Likelihood Linear Regression (MLLR) method is introduced into the SSM-based systems.Continuous Chinese speech recognition experiment on " 863test" test suite shows that the proposed method makes the error rate of Chinese characters decrease obvi ously under different decoding speeds.Experiment results indicate that the proposal can also improve the recognition performance on the SSM-based systems.

关 键 词:语音识别 说话人自适应 最大似然线性回归 随机段模型 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象