基于PLAR的说话人确认系统的噪音鲁棒性  被引量:2

Noise-robustness of speaker verification based on the perceptual log area ratio

在线阅读下载全文

作  者:尹聪[1] 白静[1] 龚宬[2] 张陈昊[2] 郑方[2] Waleed H.Abdulla 

机构地区:[1]太原理工大学信息工程学院 [2]清华大学计算机科学与技术系,清华信息科学技术国家实验室技术创新和开发部语音和语言技术中心 [3]奥克兰大学

出  处:《清华大学学报(自然科学版)》2013年第6期791-795,共5页Journal of Tsinghua University(Science and Technology)

基  金:国家自然科学基金项目(61271389);国家"九七三"重点基础研究发展计划(2013CB329302)

摘  要:针对Mel频率倒谱系数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认系统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比系数(perceptual log area ratio,PLAR)特征的说话人确认系统,并对该系统的噪音鲁棒性进行研究。结果表明:PLAR特征具有较强的噪音鲁棒性。将PLAR与MFCC进行特征域和分数域的融合,利用两者之间存在着的互补性,可有效提高说话人确认系统的识别性能。Speaker verification systems based on Mel frequency cepstral coefficients(MFCCs) have higher results in clean conditions,but the results are sharply worse in noisy environments.This paper presents a noise-robust speaker verification system based on perceptual log area ratio(PLAR) feature extraction.The results show that the PLAR is more robust to noise than the MFCCs.PLARs and MFCCs are complimentary with fusion of these two features in the feature domain and the score domain effectively improving speaker verification auuracy in noisy conditions.

关 键 词:说话人确认 感知对数面积比系数(PLAR) 鲁棒性 融合 

分 类 号:TN912[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象