检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院自动化所模式识别国家重点实验室 [2]北京工业大学电子信息与控制工程学院,北京100022 [3]北京工业大学电子信息与控制工程学院
出 处:《系统仿真学报》2005年第2期448-452,456,共6页Journal of System Simulation
基 金:国家自然科学基金项目(60172055; 60121302);北京市自然科学基金(4042025)。
摘 要:提出了一种用语音转换技术改善电话语音识别性能的方法。通过模拟真实电话信道条件下影响语音质量的各种因素,实现由纯净语音到电话语音的转换。识别试验利用模拟电话语音评估了HMM识别器做MLLR自适应前后的性能。实验数据显示,自适应前由转换语音训练的模型识别率比由纯净语音训练的模型识别率增加了18.9%,而自适应试验表明,由转换语音训练而成的模型在MLLR自适应后,系统识别性能进一步得到改善,识别率增加了5.8%。识别实验表明所提语音转换方法可以减小由于真实电话语料缺乏而造成训练语音和测试语音声学性质的不匹配,从而有效地改善电话语音识别系统的性能。A study on speech conversion technology is addressed to improve the telephone speech recognition performance. The speech conversion method is implemented by simulating the influential factors in actual telephone connections. MLLR adaptations are conducted to evaluate the performances of the HMM recognizers, which are trained from the clean speech and generated data respectively. The results without adaptation report that the models trained on generated data can give an 18.9% higher recognition rate than those on clean speech. The adaptation results show that MLLR algorithm contributes an extra increase of 5.8% to the recognition rate of telephone speech system. The experiments illustrate that telephone speech recognition performance can be effectively improved using the generated data, and the conversion method can reduce the acoustic mismatch between the training and test data, which is induced by the shortage of the actual telephone speech.
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28