语音技术在少数民族语言的应用研究  被引量:3

An Applied Research of Speech Technology in Resource-deficient Languages

在线阅读下载全文

作  者:达瓦.伊德木草 木合亚提.尼亚孜别克 吾守尔.斯拉木 

机构地区:[1]新疆维吾尔自治区多语种技术重点实验室,新疆乌鲁木齐830046 [2]新疆大学信息科学与工程学院,新疆乌鲁木齐830046

出  处:《新疆大学学报(自然科学版)》2014年第1期88-96,共9页Journal of Xinjiang University(Natural Science Edition)

基  金:国家自然科学基金(61163030);自治区科技支疆项目(201291116)资助

摘  要:本文研讨缺乏语言资源的民族语言(如维吾尔语)中如何引用语音技术、开发应用系统问题.提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根(seed)模型、再引导大语料训练生成鲁棒性声模提高连续语音识别精度实现汉民会话语音翻译系统.对维吾尔语70人发话电话语音识别实验结果显示,基于GMM–UBM–SVM方法的不特定说话人识别实验其正确识别率为94.3%,比先行GMM–UBM方法精度提升3%;基于seed声模HTK-Julius技术的维吾尔语连续语音识别实验,其识别率为72.5%,比直接使用语音文本对齐语料单靠HTK实现识别方法(63.2%)精度提高9.3%;同时本研究讨论基于Moses技术的汉维医院门诊会话语音翻译系统预测Blue值达到了57.7%.In this paper, we report our recent researches in speech techniques, such as speaker identification (SI), continuous speech recognition (CSR) and speech translation (ST), among the minority languages spoken in China, like Uyghur, Khasak and Mongolian. We tried an approach GMM-UBM-SVM for real calling SI, and HTK-Julius for CSR by Uigur and Mongolian, and Moses software for ST for medical service. Experimental results show that accuracies of 94.3%for SI with GMM-UBM-SVM, and of 72.5%for CSR by Uygur, and showed a Blue value of 57.7%for the medical service ST by Uyghur using Moses software.

关 键 词:语音技术 民语 说话人识别 连续语音识别 语音翻译 

分 类 号:TP391.42[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象