检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]江苏警官学院公安科技系,江苏南京210031 [2]公安部第一研究所,北京100048
出 处:《计算机仿真》2015年第4期154-158,共5页Computer Simulation
基 金:江苏高校优势学科建设工程资助项目(PAPD);江苏警官学院科研项目(13Q09)
摘 要:研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率。但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低。为解决上述副作用,提出在说话人识别系统中,使用一种动态时频倒谱系数参数的方法。上述方法在不减少反应话者个体特征分布特性的前提下,可消除冗余信息并降低样本特征的维度。利用上述方法提取语音特征参数并输入混合高斯-通用背景模型进行说话人语音分类。在Matlab上仿真结果表明,动态时频倒谱系数可有效改进话者语音识别系统的识别正确率。In Speech Recognition System( SRS), the dynamic feature parameters can effectively improve the recognition rate. Traditional algorithm can generate redundant information in the extraction process, which reduce the recognition rate and arithmetic speed. In order to solve the above side effects, this paper presents a parameter extraction method based on dynamic timing frequency cepstral feature (DTFC) in the SRS. The improved method can eliminate the redundant information and reduce the feature dimension in the premise of not to reduce distribution characteristics of the individual as far as possible. In addition, the SRS uses the Gaussian Mixture Model - Universal Background Model( GMM - UBM) for speaker speech classification. Matlab simulation results show that the DTFC can increase the speech recognition accuracy.
关 键 词:话者语音识别系统 美尔频率倒谱系数 滑动差分倒谱特征 动态时频倒谱系数 混合高斯-通用背景模型
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222