自适应帧长特征提取对语音识别系统性能的影响  

The Influence of Adaptive Frame-length Feature to Speech Recognition Performance

在线阅读下载全文

作  者:贺前华[1] 陆以勤[1] 韦岗[1] 

机构地区:[1]华南理工大学电子与通讯工程系,广州510641

出  处:《计算机工程》2000年第1期82-83,F003,共3页Computer Engineering

基  金:国家自然科学基金!69881001;博士点专项基金

摘  要:提出一种自适应帧长语音特征分析方法,使语音编码更准确,达到提高语音识别性能的目的。该方法包括过渡帧检测和过渡语音帧特征表示两方面。采用了两种特征表示方法。基于TIMIT语音数据包和自定义的汉语语音数据的单词识别实验表明,这两种表示方法有相同的效果,都能在一定程度上提高识别系统的性能,但计算量稍有区别。基于TIMIT数据的DHMM系统和CHMM系统的错识率分别下降了11.21%和9.58%;基于自定义数据的DHMM系统和CHMM系统的错识率分别下降了11.55%9.5%。in this paper, a speech analysis approach with adaptive frame length is proposed to solve the shortcoming of fixed frame length speech analysis, which could not provide optimal coding for every events of speech. Transient signal is detected upon spectral and temporal characteristics of speech. Two expression schedules are used to represent the feature of a transient frame. Word recognition experiments on both TIMIT and NTIMIT databases showed that the proposed speech analysis could significantly improve recognition performance, but the extla computation cost is very little. On TIMIT database, word classification with DHMM (CHMM) demonstrated a 11.21% and 9.58% error rate reduction compared with fixed frame length. and comparable results are achieved for NTIMIT database.

关 键 词:自适应帧长 语音识别 隐马尔可夫模型 

分 类 号:TN912.34[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象