基于Ⅰ-Vector特征融合的蒙古语说话人特征提取方法  

A Speaker Feature Extraction Method Based on Ⅰ-vector Resource Fusion

在线阅读下载全文

作  者:韩佳俊 马志强 王洪彬 谢秀兰 HAN Jiajun;MA Zhiqiang;WANG Hongbin;XIE Xiulan(College of Data Science and Application,Inner Mongolia University of Technology,Hohhot,Inner Mongolia 010080,China;Inner Mongolia Autonomous Region Engineering and Technology Research Center of Big Data Based Software Service,Hohhot,Inner Mongolia 010080,China)

机构地区:[1]内蒙古工业大学数据科学与应用学院,内蒙古呼和浩特010080 [2]内蒙古自治区基于大数据的软件服务工程技术研究中心,内蒙古呼和浩特010080

出  处:《中文信息学报》2023年第1期71-78,共8页Journal of Chinese Information Processing

基  金:国家自然科学基金(61762070,61862048);内蒙古自治区自然科学基金(2019MS06004);内蒙古自治区科技重大专项(2019ZD015);内蒙古自治区关键技术攻关计划项目(2019GG273)。

摘  要:针对蒙古语语料少导致蒙古语说话人自适应语音识别系统效果差的问题,该文提出一种基于Ⅰ-vector特征融合的说话人特征提取方法。首先在低资源语料和高资源语料上分别训练Ⅰ-vector模型,之后利用两者训练得到的Ⅰ-vector特征作为中间数据进行最后的特征融合训练。在蒙古语和TIMIT语料库上的实验结果表明,融合训练后Ⅰ-vector说话人特征表现较优,与融合前的Ⅰ-vector特征相比,平均WER降低了0.7%,平均SER降低了3.1%。Focused on the adaptive Mongolian speech recognition,this paper proposes a speaker feature extraction method based on Ⅰ-vector resource fusion.First,Ⅰ-vector models are trained on low-resource corpus and high-resource corpus.Then Ⅰ-vector features obtained from the two corpus are used as intermediate data for final feature fusion training.Experiments on Mongolian and TIMIT corpora show that proposed method reduced the error by 0.7% according to WER and 3.1%according to SER.

关 键 词:Ⅰ-vector 说话人自适应 特征提取 蒙古语 低资源 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象