检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]苏州大学电子信息工程学院,苏州215021 [2]上海大学通信与信息工程学院,上海200072
出 处:《声学学报》2005年第6期536-541,共6页Acta Acustica
基 金:国家自然科学基金(60172016)江苏省高校自然科学基金(04KJA510133)资助项目
摘 要:提出了一种文本无关说话人识别的全特征矢量集模型及互信息评估方法,该模型通过对一组说话人语音数据在特征空间进行聚类而形成,全面地反映了说话人语音的个性特征。对于说话人语音的似然度计算与判决,则提出了一种互信息评估方法,该算法综合分析距离空间和信息空间的似然度,并运用最大互信息判决准则进行识别判决。实验分析了线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)两种情况下应用全特征矢量集模型和互信息评估算法的说话人识别性能,并与高斯混合模型进行了比较。结果表明:全特征矢量集模型和互信息评估算法能够充分反映说话人语音特征,并能够有效评估说话人语音特征相似程度,具有很好的识别性能,是有效的。A complete feature corpus as speaker model and a evaluation algorithm of mutual information for textindependent speaker identification are proposed. The speaker model is trained by a clustering algorithm in feature vector space using speech samples with various representative pronunciation characteristics of the speaker. The evaluation algorithm is used to calculate the likelihood between input speech and the models in distance and information space, maximum mutual information decision rule is used to decide the identity of speaker. Experiments on performance analysis with comparison to GMM (Gaussian Mixture Model) method according to linear predictive cepstrum and Mel-fequency cepstrum parameters show the proposed model and evaluation algorithm is quite effective.
关 键 词:高斯混合模型 说话人识别 最大互信息 评估方法 特征矢量 文本无关 MEL频率倒谱系数 线性预测倒谱系数 语音数据
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.31