基于最大似然线性回归矩阵的说话人识别算法研究  

Research on MLLR Based Speaker Recognition Algorithm

在线阅读下载全文

作  者:钟山[1] 何亮[1] 邓妍[1] 刘加[1] 

机构地区:[1]清华大学电子工程系清华信息科学与技术国家实验室(筹),北京100084

出  处:《自动化学报》2009年第5期546-550,共5页Acta Automatica Sinica

基  金:国家高技术研究发展计划(863计划)(2006AA010101;2007AA04Z223);国家自然科学基金委员会与微软亚洲研究院联合资助项目(60776800)资助~~

摘  要:研究了将自适应领域的最大似然线性回归(Maximum likelihood linear regression,MLLR)变换矩阵作为特征进行文本无关的说话人识别算法.本文引入了基于统一背景模型的MLLRSV-SVM说话人识别算法,并在此基础上进行高层音素聚类以进一步提高识别性能.在采用多种信道补偿技术后,在NISTSRE2006年1训练语段-1测试语段同信道和跨信道数据库上,基于MLLR特征的系统与其他最好的系统性能接近并有很强的互补性,经过简单线性融合可以极大提高识别性能.This paper uses the maximum likelihood linear regression (MLLR) as feature for text-independent speaker recognition algorithm. We introduce a universal background model (UBM) based MLLRSV-SVM algorithm first, and then extend the algorithm to multi-class for improvement. After channel compensation, in terms of the NIST 2006 SRE lconv4w-lconv4w/mic corpus, the MLLR based system is comparable with and complementary of the state of the art systems. The performance is greatly improved by simply linear fusion.

关 键 词:说话人识别 最大似然线性回归 支持向量机 信道补偿 

分 类 号:TP391.42[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象