基于FMFCC和HMM的说话人识别  被引量:8

Speaker Recognition Based on FMFCC and HMM

在线阅读下载全文

作  者:张永亮[1] 张先庭[1] 鲁宇明[2] 

机构地区:[1]南昌航空大学电子信息工程学院,江西南昌330063 [2]南京航空航天大学自动化学院,江苏南京210016

出  处:《计算机仿真》2010年第5期352-354,358,共4页Computer Simulation

基  金:南昌航空大学校基金(EC200604057)

摘  要:美尔频率倒谱系数(MFCC)是说话人识别中常用的特征参数,而语音信号是非平稳信号,MFCC并不能很好的反映语音的时频特性。针对这一缺陷,为了提高说话人的识别率,结合新的时频分析工具分数傅立叶变换(FRFT)。将MFCC推广到分数形式,得到分数美尔频率倒谱系数(FMFCC),用以表征语音信号的特征;并利用可分性测度验证了特征参数的有效性;通过建立20个不同说话人的FMFCC特征库,采用隐马尔可夫模型(HMM)对说话人进行仿真识别。仿真结果表明,在合适的变换阶次下,说话人的平均识别率可达93%以上。Mel frequency cepstral coefficient (MFCC) is a frequently - used characteristic in speaker recogniton. In evidence, speech are non - stationary signals, the time - frequency characteristic of speech is not clearly expressed through MFCC. Thus, in the calculation of MFCC parameter, fractional Fourier transform (FRFT) is adopted to replace discrete Fourier transform. Then fractional Mel frequency cepstral coefficient (FMFCC) is acquired, and the effectivity of the parameter is verified. Finally, the Hidden Markov Model (HMM) of 20 different speakers is estab- lished, and speaker identification is performed. The simulation shows that in different transform orders, the average of right speaker recognition rate is up to 93%.

关 键 词:分数傅立叶变换 频率倒谱系数 隐马尔可夫模型 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象