说话人识别中的因子分析以及空间拼接  被引量:14

Factor Analysis and Space Assembling in Speaker Recognition

在线阅读下载全文

作  者:郭武[1] 李轶杰[1] 戴礼荣[1] 王仁华[1] 

机构地区:[1]中国科学技术大学多媒体计算与通信教育部一微软重点实验室,合肥230027

出  处:《自动化学报》2009年第9期1193-1198,共6页Acta Automatica Sinica

基  金:国家自然科学基金(60970161);多媒体计算与通信教育部-微软重点实验室科研基金资助(07122803)~~

摘  要:联合因子分析可以有效拟合混合高斯模型中的说话人和信道差异,在说话人识别中得到广泛应用.一般情况下,该算法在对说话人和信道两个载荷矩阵进行联合估计时,说话人残差矩阵无法发挥作用,信道载荷矩阵的因子数不能提高.本文提出说话人载荷矩阵、说话人残差载荷矩阵采用串行的训练模式,在信道载荷矩阵训练中采用矩阵拼接的方法,能够有效提高识别率;在NIST SRE 2008年核心测试数据库的五个部分分别达到等错误率3.3%,5.1%,5.0%,5.3%和5.0%.Factor analysis is a model of the speaker and session variability in Gaussian mixture models and is widely used in text-independent speaker recognition. There exist two issues when the loading matrices of the eigenvoice and eigenchannel are estimated jointly. First, the speaker diagonal matrix (residual) will not take effect; second, the channel factors can not be very large. In this paper, the loading matrices of eigenvoice and the diagonal are calculated serially and different eigenchannel matrices are assembled to form a large channel loading matrix. The performance can be improved by the proposed algorithm. In the NIST speaker recognition evaluation (SRE) 2008 core test corpus, the equal error rates (EERs) of the five sub sessions were 3.3 %, 5.1%, 5.0 %, 5.3 %, and 5.0 %.

关 键 词:说话人识别 联合因子分析 本征音因子 说话人确认 期望最大化 

分 类 号:TN912.34[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象