说话人识别中的总变化因子分析技术  

Speaker Recognition System Based on Total Variable Analysis

在线阅读下载全文

作  者:杨琳[1] 黄远 杨晶超 汪俊杰[1] 索宏彬[1] 

机构地区:[1]中国科学院声学研究所语言声学与内容理解重点实验室,北京100190 [2]国家计算机网络应急技术处理协调中心,北京100190

出  处:《网络新媒体技术》2013年第2期26-30,共5页Network New Media Technology

基  金:国家自然科学基金(批准号:10925419;90920302;61072124;11074275;11161140319);中国科学院战略性先导科技专项(面向感知中国的新一代信息技术研究;编号:XDA06030100)经费资助

摘  要:研究并实现了总变化因子分析(Total Variability Factor Analysis)技术,该技术在对说话人进行建模的时候,不区分语音中的说话人信息和信道信息,而是将整个语音空间(总变化空间)进行建模,然后在这个空间上对训练和测试语音计算其相应的总变化因子向量(Ivector),来作为支持向量机(Support Vector Machine,SVM)建模和分类的特征。为了降低信道对识别的影响,我们使用线性鉴别分析(Linear Discriminant Analysis,LDA)降维技术以及类内协方差规整(Within-Class Covariance Normalization,WCCN)技术对Ivector进行信道补偿。实验结果表明同时使用WCCN和LDA对Ivector进行信道补偿要好于单独使用WCCN或LDA;并且与传统的联合因子分析系统(Joint Factor Analysis,JFA)相比,以作为评价指标,在男、女测试集上,等错率(Equal Error Ratio,EER)分别相对降低1.20%和9.27%。Factor analysis is the main technique in the current domain of speaker recognition, which aims to eliminate the problem of channel mismatch. In this paper the total variability factor analysis technique is studied, also named Ivector. Ivector builds the total variable space and is different from the traditional joint factor analysis (JFA) which discriminate the model space into speaker space and channel space. Moreover, the channel compensation is implemented by LDA (Linear Discriminant Analysis) and WCCN (Within - Class Covariance Normalization) method. The experimental results show that the IVector technique has the better performance than JFA in Nist SRE2010 set.

关 键 词:因子分析 说话人识别 信道补偿 

分 类 号:TN912.34[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象