一种改进动态特征参数的话者语音识别系统  被引量:4

A Speaker Voice Recognition System of Improved Dynamic Characteristic Parameters

在线阅读下载全文

作  者:申小虎[1] 万荣春[1] 张新野[2] 

机构地区:[1]江苏警官学院公安科技系,江苏南京210031 [2]公安部第一研究所,北京100048

出  处:《计算机仿真》2015年第4期154-158,共5页Computer Simulation

基  金:江苏高校优势学科建设工程资助项目(PAPD);江苏警官学院科研项目(13Q09)

摘  要:研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率。但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低。为解决上述副作用,提出在说话人识别系统中,使用一种动态时频倒谱系数参数的方法。上述方法在不减少反应话者个体特征分布特性的前提下,可消除冗余信息并降低样本特征的维度。利用上述方法提取语音特征参数并输入混合高斯-通用背景模型进行说话人语音分类。在Matlab上仿真结果表明,动态时频倒谱系数可有效改进话者语音识别系统的识别正确率。In Speech Recognition System( SRS), the dynamic feature parameters can effectively improve the recognition rate. Traditional algorithm can generate redundant information in the extraction process, which reduce the recognition rate and arithmetic speed. In order to solve the above side effects, this paper presents a parameter extraction method based on dynamic timing frequency cepstral feature (DTFC) in the SRS. The improved method can eliminate the redundant information and reduce the feature dimension in the premise of not to reduce distribution characteristics of the individual as far as possible. In addition, the SRS uses the Gaussian Mixture Model - Universal Background Model( GMM - UBM) for speaker speech classification. Matlab simulation results show that the DTFC can increase the speech recognition accuracy.

关 键 词:话者语音识别系统 美尔频率倒谱系数 滑动差分倒谱特征 动态时频倒谱系数 混合高斯-通用背景模型 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象