检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:尹聪[1] 白静[1] 龚宬[2] 张陈昊[2] 郑方[2] Waleed H.Abdulla
机构地区:[1]太原理工大学信息工程学院 [2]清华大学计算机科学与技术系,清华信息科学技术国家实验室技术创新和开发部语音和语言技术中心 [3]奥克兰大学
出 处:《清华大学学报(自然科学版)》2013年第6期791-795,共5页Journal of Tsinghua University(Science and Technology)
基 金:国家自然科学基金项目(61271389);国家"九七三"重点基础研究发展计划(2013CB329302)
摘 要:针对Mel频率倒谱系数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认系统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比系数(perceptual log area ratio,PLAR)特征的说话人确认系统,并对该系统的噪音鲁棒性进行研究。结果表明:PLAR特征具有较强的噪音鲁棒性。将PLAR与MFCC进行特征域和分数域的融合,利用两者之间存在着的互补性,可有效提高说话人确认系统的识别性能。Speaker verification systems based on Mel frequency cepstral coefficients(MFCCs) have higher results in clean conditions,but the results are sharply worse in noisy environments.This paper presents a noise-robust speaker verification system based on perceptual log area ratio(PLAR) feature extraction.The results show that the PLAR is more robust to noise than the MFCCs.PLARs and MFCCs are complimentary with fusion of these two features in the feature domain and the score domain effectively improving speaker verification auuracy in noisy conditions.
关 键 词:说话人确认 感知对数面积比系数(PLAR) 鲁棒性 融合
分 类 号:TN912[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.112