用于抗噪声语音识别的谐振强度特征  被引量:1

Harmonic intensity feature for robust speech recognition

在线阅读下载全文

作  者:许超[1] 曹志刚[1] 

机构地区:[1]清华大学电子工程系,北京100084

出  处:《清华大学学报(自然科学版)》2004年第1期22-24,28,共4页Journal of Tsinghua University(Science and Technology)

基  金:国家自然科学基金资助项目(60072011)

摘  要:基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。Automatic speech recognition (ASR) in noisy environments is a challenging problem. The performance of traditional Mel-frequency cepstral coefficient (MFCC) feature based ASR systems is dramatically degraded by additive noise. The harmonic intensity (H) feature was used to develop a robust ASR to replace the zero-order cepstral coefficient (C_0) or frame energy (E) feature in the MFCCs. A C_0-based ASR system, an E-based ASR system, and an H-based ASR system were tested with noise corrupted speech. The results show that the H-based ASR system has higher recognition accuracy and better robustness than the other systems.

关 键 词:抗噪声 语音识别 谐波模型 MEL倒谱系数 

分 类 号:TN912.34[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象