检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:郭武[1] 李轶杰[1] 戴礼荣[1] 王仁华[1]
机构地区:[1]中国科学技术大学多媒体计算与通信教育部一微软重点实验室,合肥230027
出 处:《自动化学报》2009年第9期1193-1198,共6页Acta Automatica Sinica
基 金:国家自然科学基金(60970161);多媒体计算与通信教育部-微软重点实验室科研基金资助(07122803)~~
摘 要:联合因子分析可以有效拟合混合高斯模型中的说话人和信道差异,在说话人识别中得到广泛应用.一般情况下,该算法在对说话人和信道两个载荷矩阵进行联合估计时,说话人残差矩阵无法发挥作用,信道载荷矩阵的因子数不能提高.本文提出说话人载荷矩阵、说话人残差载荷矩阵采用串行的训练模式,在信道载荷矩阵训练中采用矩阵拼接的方法,能够有效提高识别率;在NIST SRE 2008年核心测试数据库的五个部分分别达到等错误率3.3%,5.1%,5.0%,5.3%和5.0%.Factor analysis is a model of the speaker and session variability in Gaussian mixture models and is widely used in text-independent speaker recognition. There exist two issues when the loading matrices of the eigenvoice and eigenchannel are estimated jointly. First, the speaker diagonal matrix (residual) will not take effect; second, the channel factors can not be very large. In this paper, the loading matrices of eigenvoice and the diagonal are calculated serially and different eigenchannel matrices are assembled to form a large channel loading matrix. The performance can be improved by the proposed algorithm. In the NIST speaker recognition evaluation (SRE) 2008 core test corpus, the equal error rates (EERs) of the five sub sessions were 3.3 %, 5.1%, 5.0 %, 5.3 %, and 5.0 %.
关 键 词:说话人识别 联合因子分析 本征音因子 说话人确认 期望最大化
分 类 号:TN912.34[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.137.142.253