检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:韩佳俊 马志强 王洪彬 谢秀兰 HAN Jiajun;MA Zhiqiang;WANG Hongbin;XIE Xiulan(College of Data Science and Application,Inner Mongolia University of Technology,Hohhot,Inner Mongolia 010080,China;Inner Mongolia Autonomous Region Engineering and Technology Research Center of Big Data Based Software Service,Hohhot,Inner Mongolia 010080,China)
机构地区:[1]内蒙古工业大学数据科学与应用学院,内蒙古呼和浩特010080 [2]内蒙古自治区基于大数据的软件服务工程技术研究中心,内蒙古呼和浩特010080
出 处:《中文信息学报》2023年第1期71-78,共8页Journal of Chinese Information Processing
基 金:国家自然科学基金(61762070,61862048);内蒙古自治区自然科学基金(2019MS06004);内蒙古自治区科技重大专项(2019ZD015);内蒙古自治区关键技术攻关计划项目(2019GG273)。
摘 要:针对蒙古语语料少导致蒙古语说话人自适应语音识别系统效果差的问题,该文提出一种基于Ⅰ-vector特征融合的说话人特征提取方法。首先在低资源语料和高资源语料上分别训练Ⅰ-vector模型,之后利用两者训练得到的Ⅰ-vector特征作为中间数据进行最后的特征融合训练。在蒙古语和TIMIT语料库上的实验结果表明,融合训练后Ⅰ-vector说话人特征表现较优,与融合前的Ⅰ-vector特征相比,平均WER降低了0.7%,平均SER降低了3.1%。Focused on the adaptive Mongolian speech recognition,this paper proposes a speaker feature extraction method based on Ⅰ-vector resource fusion.First,Ⅰ-vector models are trained on low-resource corpus and high-resource corpus.Then Ⅰ-vector features obtained from the two corpus are used as intermediate data for final feature fusion training.Experiments on Mongolian and TIMIT corpora show that proposed method reduced the error by 0.7% according to WER and 3.1%according to SER.
关 键 词:Ⅰ-vector 说话人自适应 特征提取 蒙古语 低资源
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:52.14.186.84