检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南昌航空大学电子信息工程学院,江西南昌330063 [2]南京航空航天大学自动化学院,江苏南京210016
出 处:《计算机仿真》2010年第5期352-354,358,共4页Computer Simulation
基 金:南昌航空大学校基金(EC200604057)
摘 要:美尔频率倒谱系数(MFCC)是说话人识别中常用的特征参数,而语音信号是非平稳信号,MFCC并不能很好的反映语音的时频特性。针对这一缺陷,为了提高说话人的识别率,结合新的时频分析工具分数傅立叶变换(FRFT)。将MFCC推广到分数形式,得到分数美尔频率倒谱系数(FMFCC),用以表征语音信号的特征;并利用可分性测度验证了特征参数的有效性;通过建立20个不同说话人的FMFCC特征库,采用隐马尔可夫模型(HMM)对说话人进行仿真识别。仿真结果表明,在合适的变换阶次下,说话人的平均识别率可达93%以上。Mel frequency cepstral coefficient (MFCC) is a frequently - used characteristic in speaker recogniton. In evidence, speech are non - stationary signals, the time - frequency characteristic of speech is not clearly expressed through MFCC. Thus, in the calculation of MFCC parameter, fractional Fourier transform (FRFT) is adopted to replace discrete Fourier transform. Then fractional Mel frequency cepstral coefficient (FMFCC) is acquired, and the effectivity of the parameter is verified. Finally, the Hidden Markov Model (HMM) of 20 different speakers is estab- lished, and speaker identification is performed. The simulation shows that in different transform orders, the average of right speaker recognition rate is up to 93%.
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30