检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]解放军理工大学通信工程学院研究生1队,江苏南京210007 [2]解放军理工大学通信工程学院 [3]解放军理工大学通信工程学院研究生5队
出 处:《军事通信技术》2014年第4期43-48,共6页Journal of Military Communications Technology
基 金:中兴通讯产学研合作研究资助项目(CON1307160001)
摘 要:针对说话人识别系统的噪声鲁棒性问题,文章采用了基于信噪比估计从而选取高信噪比语音帧的前端处理方法。根据一定阈值去除语音中信噪比较低的语音帧,对保留的语音帧提取特征参数并进行识别。该方法的有效性取决于分帧信噪比估计的准确性。由于传统的谱减法以及滤波法难以对非平稳噪声信噪比进行准确估计,文中提出了使用改进的最小值控制递归平均算法进行信噪比估计来实现高信噪比帧筛选,实验结果表明,与基于维纳滤波语音增强的GMM-UBM系统对比,5dB street噪声下识别率由78.5%提升至85.5%,5dB car噪声下识别率由88%提升至91%。To improve the noise robustness of speaker recognition systems,the signal to noise ratio estimation front-end method was applied,discarding some speech frames of low SNR according to a certain threshold and using the remaining for feature extraction and recognition.The effectiveness of this method largely depends on the accuracy of the signal to noise ratio estimation.Traditional spectral subtraction or signal filtering cannot estimate the SNR of none stationary noisy speech accurately,so improved minima controlled recursive averaging algorithm was proposed instead.Compared with the wiener filtering speech enhancement based front-end system,experimental results show that in the none stationary 5dB street noise environment,the recognition rate is improved from 78.5%to 85.5%,and that in the stationary 5dB car noise environment,the recognition rate is improved from 88%to 91%.
关 键 词:说话人识别 信噪比估计 最小值控制递归平均 高斯混合模型
分 类 号:TN912.34[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222