最小方差无失真响应感知倒谱系数在说话人识别中的应用被引量：4

Perceptual MVDR-based cepstral coefficients for speaker recognition

作　　者：梁春燕[1] 张翔[1] 杨琳[1] 张建平[1] 颜永红[1]

机构地区：[1]中国科学院声学研究所中国科学院语言声学与内容理解重点实验室,北京100190

出　　处：《声学学报》2012年第6期673-678,共6页Acta Acustica

基　　金：国家自然科学基金资助项目(10925419,90920302,10874203,60875014,61072124,11074275)

摘　　要：研究最小方差无失真响应感知倒谱系数在说话人识别中的应用。提取最小方差无失真响应感知倒谱系数,对其进行高斯混合模型建模并采用联合因子分析的方法来拟合高斯混合模型中的说话人和信道差异,在美国国家标准技术研究院2008年说话人识别评测核心测试集上分别对最小方差无失真响应感知倒谱系数和传统的Mel频率倒谱系数进行测试。结果显示,两种不同特征的系统性能相当,采用线性融合方法后,在不同测试集上的等错误率相对下降了7.6%～30.5%,最小检测错误代价相对下降了3.2%～21.2%。实验表明,最小方差无失真响应感知倒谱系数能有效应用于说话人识别中,且与传统的Mel频率倒谱系数存在一定程度的互补性。A new feature extraction technique named perceptual MVDR-based cepstral coefficients （PMCCs） is intro- duced into speaker recognition. PMCCs are extracted and modeled using Gaussian Mixture Models （GMMs） for speaker recognition. In order to compensate for speaker and channel variability effects, joint factor analysis （JFA） is used. The experiments are carried out on the core conditions of NIST 2008 speaker recognition evaluation data. The experimental results show that the systems based on PMCCs can achieve comparable performance to those based on the conventional MFCCs. Besides, the fusion of the two kinds of systems can make significant performance improvement compared to the MFCCs system alone, reducing equal error rate （EER） by the factor between 7.6% and 30.5% as well as minimum detect cost function （minDCF） by the factor between 3.2% and 21.2% on different test sets. The results indicate that PMCCs can be effectively applied in speaker recognition and they are complementary with MFCCs to some extent.

关键词：MEL频率倒谱系数最小方差无失真响应说话人识别感知应用高斯混合模型标准技术研究院测试集

分类号：TN912.34[电子电信—通信与信息系统]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

最小方差无失真响应感知倒谱系数在说话人识别中的应用被引量：4

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

最小方差无失真响应感知倒谱系数在说话人识别中的应用 被引量：4

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

最小方差无失真响应感知倒谱系数在说话人识别中的应用被引量：4