发音错误检错中声学模型训练准则的比较研究  

A Comparative Study on Acoustic Model Training for Automatic Mispronunciation Detection

在线阅读下载全文

作  者:王建明[1] 黄浩[1] 王羡慧[1] 

机构地区:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830046

出  处:《新疆大学学报(自然科学版)》2013年第2期211-217,共7页Journal of Xinjiang University(Natural Science Edition)

基  金:国家自然科学基金资助项目(60965002);新疆高校科研计划培育基金资助项目(XJEDU2008S15);新疆大学博士科研启动基金资助项目(BS090143)

摘  要:在发音错误检错系统中,将传统语音识别系统中的最大似然估计准则和最小音素错误准则应用于声学模型训练通常不能获得F1值指标意义下的最佳性能.本文在对最大似然准则以及最小音素错误准则参数更新公式进行分析的基础上,提出了最大化F1值函数的区分性训练准则,并利用构造弱意义辅助函数的方法对声学模型参数进行优化.通过比较,发现最大化F1值函数的区分性训练准则能够有效地增大训练和测试数据检错的F1值,同时训练数据和测试数据上的精确度、召回率都有明显改进.In automatic mispronunciation detection system, the acoustic model trained by traditional model training criteria such as Maximum Likelihood Estimation and Minimum Phone Error will not achieve the best performance in accordance with the maximization of the F1 -score objective function. In this paper, based on the analysis of the optimization algorithms of maximum likelihood and minimum phone error training, we propose the Maximum F1 -score training criterion. The objective function maximization is achieved by using the weak-sense auxiliary function method. Experiments have shown the method is effective in increasing the F1 -score, Precision and Recall on both the training data and evaluation data.

关 键 词:最大似然估计 最小音素错误 最大化F1值 辅助函数 

分 类 号:TP912.34[自动化与计算机技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象