基于子带二次谱熵的语音端点检测  被引量:3

Voice Activity Detection Based on Sub-band Reprocessed Pectrum Entropy

在线阅读下载全文

作  者:朱建伟[1,2] 孙水发[1] 但志平[1] 雷帮军[1] 

机构地区:[1]三峡大学智能视觉与图像信息研究所,湖北宜昌443002 [2]三峡大学电气与新能源学院,湖北宜昌443002

出  处:《微电子学与计算机》2011年第3期77-80,共4页Microelectronics & Computer

基  金:国家自然科学基金项目(60972162);湖北省自然科学基金项目(2008CDB346);湖北省教育厅重大项目(Z20081301);湖北省高等学校优秀中青年科技创新团队计划项目(T201002);湖北省教育厅中青年项目(Q20101202;Q20101205);宜昌市科学技术研究与开发项目(A09302-31;A09302-32;A2010-302-10)

摘  要:为了提高在强噪声环境下语音端点检测的准确度,提出基于子带二次谱熵的端点检测算法.该算法把子带二次谱熵作为端点检测新的特征参数,首先计算每帧语音信号的二次谱,再多子带分析,计算二次谱熵;引入顺序统计滤波对二次谱熵平滑处理;将有限状态机判别方法与子带二次谱熵相合,形成新的语音/噪声判别算法,有效地解决单门限法易出现的两类误判.实验表明:与传统的两种方法相比,提出的端点检测算法具有准确性高、抗噪性强等优点.Voice activity detection(VAD) in strong noise environments is improved by an algorithm based on subband reprocessed spectrum entropy(BRSE).As a new feature parameter for VAD,the reprocessed spectrum is calculated firstly,and reprocessed spectrum entropy is then calculated with multi-sub-band analysis.The order statistics filter is selected to smooth the BRPE.A new voice / noise discrimination algorithm is proposed by combining the finite state machine(FSM) with BRSE.The misdetections caused by single-threshold are reduced greatly.Experimental results show that the proposed algorithm has higher accuracy and stronger robustness than other two methods.

关 键 词:端点检测 子带二次谱熵 有限状态机 顺序统计滤波 

分 类 号:TN912.3[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象