基于总体变化子空间自适应的i-vector说话人识别系统研究  被引量:17

Total Variability Subspace Adaptation Based Speaker Recognition

在线阅读下载全文

作  者:栗志意[1] 张卫强[1] 何亮[1] 刘加[1] 

机构地区:[1]清华大学电子工程系清华信息与科学技术国家实验室,北京100084

出  处:《自动化学报》2014年第8期1836-1840,共5页Acta Automatica Sinica

基  金:国家自然科学基金(61370034;61273268;61005019;90920302);北京市自然科学基金项目(KZ201110005005)资助~~

摘  要:在说话人识别研究中,基于身份认证矢量(identity vector,i-vector)的子空间建模被证明是目前最前沿最有效的说话人建模技术,其中如何有效准确地估计总体变化子空间矩阵T成为影响系统性能好坏的关键问题.本文针对i-vector技术如何在新的应用环境下进行总体变化子空间矩阵T的自适应估计问题进行了研究,并提出了两种行之有效的自适应估计算法.在由美国国家标准技术局(American National Institute of Standard and Technology,NIST)组织的2008年说话人识别核心评测数据库以及自行采集的测试数据库上的实验结果显示,不论采用测试集数据本身还是与测试集较匹配的开发集数据,通过本文所提的自适应算法来更新总体变化子空间矩阵均可以使更新后的子空间更有利于新测试数据下的低维子空间描述,在新的测试环境下都更有利于说话人分类.此外实验结果还表明基于多子空间拼接的子空间自适应方法性能明显优于迭代自适应方法,而且两者的结合可达到最优的识别性能,且此时利用开发集数据进行自适应可以接近其利用测试集数据进行自适应得到的最优性能.In text-independent speaker recognition, the iden- tity vector (i-vector) based modeling method has recently been proved to be the most popular and efficient method. It is a key problem to estimate the total variability subspace T effi- ciently and accurately. In this paper, two adaptation algorithms are proposed in order to improve the performance of the i-vector base system in practical environments. Experiments on the 2008 core speaker recognition evaluation dataset of American NIST and Technology and the self-collected speaker recognition eval- uation dataset demonstrate that using the proposed adaptation algorithms to adapt to the totM variability subspace T from ei- ther the test dataset or the developing dataset is effective for improving the performance. In addition, the combination of the two adaptation algorithms can achieve almost the best perfor- mance usingthe develoDingdataset rather than the test dataset.

关 键 词:身份认证矢量 总体变化子空间 自适应 说话人识别 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象