文本无关说话人识别的全特征矢量集模型及互信息评估方法被引量：7

Text-independent speaker identification using complete feature corpus and mutual information evaluation

机构地区：[1]苏州大学电子信息工程学院,苏州215021 [2]上海大学通信与信息工程学院,上海200072

出　　处：《声学学报》2005年第6期536-541,共6页Acta Acustica

基　　金：国家自然科学基金(60172016)江苏省高校自然科学基金(04KJA510133)资助项目

摘　　要：提出了一种文本无关说话人识别的全特征矢量集模型及互信息评估方法,该模型通过对一组说话人语音数据在特征空间进行聚类而形成,全面地反映了说话人语音的个性特征。对于说话人语音的似然度计算与判决,则提出了一种互信息评估方法,该算法综合分析距离空间和信息空间的似然度,并运用最大互信息判决准则进行识别判决。实验分析了线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)两种情况下应用全特征矢量集模型和互信息评估算法的说话人识别性能,并与高斯混合模型进行了比较。结果表明:全特征矢量集模型和互信息评估算法能够充分反映说话人语音特征,并能够有效评估说话人语音特征相似程度,具有很好的识别性能,是有效的。A complete feature corpus as speaker model and a evaluation algorithm of mutual information for textindependent speaker identification are proposed. The speaker model is trained by a clustering algorithm in feature vector space using speech samples with various representative pronunciation characteristics of the speaker. The evaluation algorithm is used to calculate the likelihood between input speech and the models in distance and information space, maximum mutual information decision rule is used to decide the identity of speaker. Experiments on performance analysis with comparison to GMM （Gaussian Mixture Model） method according to linear predictive cepstrum and Mel-fequency cepstrum parameters show the proposed model and evaluation algorithm is quite effective.

关键词：高斯混合模型说话人识别最大互信息评估方法特征矢量文本无关 MEL频率倒谱系数线性预测倒谱系数语音数据

分类号：TN912.3[电子电信—通信与信息系统]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

文本无关说话人识别的全特征矢量集模型及互信息评估方法被引量：7

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

文本无关说话人识别的全特征矢量集模型及互信息评估方法 被引量：7

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

文本无关说话人识别的全特征矢量集模型及互信息评估方法被引量：7