检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:梁春燕[1,2] 杨琳[2] 周若华[2] 颜永红[2]
机构地区:[1]山东理工大学计算机科学与技术学院,淄博255049 [2]中国科学院声学研究所中国科学院语言声学与内容理解重点实验室,北京100190
出 处:《声学学报》2015年第1期28-33,共6页Acta Acustica
基 金:国家自然科学基金(10925419;90920302;61072124;11074275;11161140319;91120001;61271426);中国科学院战略性先导科技专项(XDA06030100;XDA06030500);国家863计划(2012AA012503);中国科学院重点部署项目(KGZD-EW-103-2)资助
摘 要:研究韵律特征在说话人确认中的应用。将整个韵律轨迹以固定段长和段移进行片段划分,并对其进行勒让德多项式拟合从而获取连续性的韵律特征,将特征映射到总变化因子空间,并用概率线性判别分析来补偿说话人和场景的差异。在美国国家标准技术研究院2010年说话人识别评测扩展核心测试集5的基础上加入噪声构造测试集,并分别对韵律特征和传统Mel频率倒谱系数进行测试。结果显示,随着信噪比的逐渐减小,Mel频率倒谱系数性能出现大幅度下降,而韵律特征性能相对比较稳定,两种特征融合后能使系统性能得到进一步提升,等错率和最小检测错误代价相对于Mel频率倒谱系数单系统最多能分别下降9%和11%。实验表明,韵律特征应用于说话人识别中具有较强的噪声鲁棒性,且与传统的Mel频率倒谱系数存在较强的互补性。The use of continuous prosodic features is introduced into speaker verification. The whole prosodic contour is segmented over fixed-frame long with fixed-frame shift and the prosodic features are extracted using a basis consisting of Legendre polynomials. They are then modeled using the i-vector based approach followed by probabilistic linear diseriminant analysis (PLDA) to compensate for speaker and channel variability effects in the space of i-vectors. The experiments are carried out on the noisy conditions which are generated based on the extended condition 5 of the NIST 2010 Speaker Recognition Evaluation (SRE) dataset. The experimental results indicate that the prosodic features are noise-robust and the fusion of the prosodic features and the traditional Mel Frequency Cepstral Coefficients (MFCCs) can make significant performance improvement. Compared to the MFCCs system alone~ the fusion can provide up to 9% and 11% relative improvement respectively in equal error rate (EER) and minimum detection cost function (minDCF).
关 键 词:线性判别分析 说话人确认 韵律特征 MEL频率倒谱系数 应用 概率 标准技术研究院 说话人识别
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.133.13.2