语音转换技术在电话语音识别中的应用研究(英文)  

Speech Conversion for Telephone Speech Recognition

在线阅读下载全文

作  者:左国玉 刘文举[1] 阮晓钢[3] 

机构地区:[1]中国科学院自动化所模式识别国家重点实验室 [2]北京工业大学电子信息与控制工程学院,北京100022 [3]北京工业大学电子信息与控制工程学院

出  处:《系统仿真学报》2005年第2期448-452,456,共6页Journal of System Simulation

基  金:国家自然科学基金项目(60172055; 60121302);北京市自然科学基金(4042025)。

摘  要:提出了一种用语音转换技术改善电话语音识别性能的方法。通过模拟真实电话信道条件下影响语音质量的各种因素,实现由纯净语音到电话语音的转换。识别试验利用模拟电话语音评估了HMM识别器做MLLR自适应前后的性能。实验数据显示,自适应前由转换语音训练的模型识别率比由纯净语音训练的模型识别率增加了18.9%,而自适应试验表明,由转换语音训练而成的模型在MLLR自适应后,系统识别性能进一步得到改善,识别率增加了5.8%。识别实验表明所提语音转换方法可以减小由于真实电话语料缺乏而造成训练语音和测试语音声学性质的不匹配,从而有效地改善电话语音识别系统的性能。A study on speech conversion technology is addressed to improve the telephone speech recognition performance. The speech conversion method is implemented by simulating the influential factors in actual telephone connections. MLLR adaptations are conducted to evaluate the performances of the HMM recognizers, which are trained from the clean speech and generated data respectively. The results without adaptation report that the models trained on generated data can give an 18.9% higher recognition rate than those on clean speech. The adaptation results show that MLLR algorithm contributes an extra increase of 5.8% to the recognition rate of telephone speech system. The experiments illustrate that telephone speech recognition performance can be effectively improved using the generated data, and the conversion method can reduce the acoustic mismatch between the training and test data, which is induced by the shortage of the actual telephone speech.

关 键 词:语音转换 模拟电话语音 语音识别 MLLR 

分 类 号:TN912.3[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象