检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:古典 李辉[1] Gu Dian;Li Hui(Department of Electronic Science and Technology, University of Science and Technology of China, Hefei 230027, Chin)
机构地区:[1]中国科学技术大学电子科学与技术系,安徽合肥230027
出 处:《信息技术与网络安全》2018年第4期60-64,共5页Information Technology and Network Security
摘 要:在说话人自适应领域,基于深度神经网络(DNN)的说话人自适应方法已成为主流方法。学习性隐层单元贡献(LHUC)作为一种有效的无监督自适应方法比其他自适应方法有诸多优势,而自适应数据的稀疏问题却导致识别性能受到影响。为了降低数据稀疏所带来的影响,在原有LHUC技术的基础上,加入i-vector及多任务学习这两种方法分别与其相结合。在TEDLIUM语料库上进行实验,实验结果表明,两种融合方法都比原系统表现出了更好的性能,单词错误率(WER)分别相对降低了2.5%和1.9%。The approaches based on deep neural network( DNN) have become popular in speaker adaptation field. As an effective unsupervised speaker adaptation approach,learning hidden unit contributions( LHUC) has many advantages over other approaches,but the sparse adaptation data may cause the recognition performance degradation. In order to reduce the influence of this problem,i-vector based approach and multitask learning are added to combine with LHUC respectively. Experiments are carried out on TED-LIUM corpus and results show that the two fusion approaches perform better than original system. The reduction of word error rate( WER) is 2. 5% and 1. 9% respectively.
关 键 词:说话人自适应 LHUC i-vector 多任务学习
分 类 号:TN912.34[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145