基于隐马尔可夫模型的非监督噪声功率谱估计  被引量:4

Unsupervised Noise Power Estimation Using Hidden Markov Model

在线阅读下载全文

作  者:许春冬[1,2,3] 战鸽 应冬文[1] 李军锋[1] 颜永红[1] 

机构地区:[1]中国科学院声学研究所语言声学与内容理解重点实验室,北京100190 [2]江西理工大学信息工程学院,赣州341000 [3]北京理工大学信息与电子学院,北京100081

出  处:《数据采集与处理》2015年第2期359-364,共6页Journal of Data Acquisition and Processing

基  金:国家重点基础研究发展计划("九七三"计划)(2013CB329302)资助项目;国家自然科学基金(61271426;10925419;90920302;61072124;11074275;11161140319)资助项目;中国科学院战略性先导科技专项(XDA06030100;XDA06030500)资助项目;中国科学院重点部署(KGZD-EW-103-2)资助项目;江西理工大学科研基金(NSFJ2015-G21)资助项目

摘  要:噪声功率谱估计是语音增强算法的基本组成部分,传统算法大多采用启发式的估计方法,因而不能保证噪声估计值的统计最优。提出了一种基于极大似然的非监督噪声功率谱估计方法,采用隐马尔可夫模型(Hidden Markov model,HMM)在每个子带建立语音和非语音对数功率谱的统计模型,模型包含语音和非语音两个高斯分量,其中非语音高斯分量的均值表示噪声功率谱估计值,根据最大期望(Expectation maximization,EM)算法得到包括噪声均值在内的HMM参数集。针对语音信号可能出现的长时缺失,对HMM引入了一些约束条件,保证了模型的稳定性。实验表明,该方法获得的极大似然噪声估计优于基于启发式的经典方法获得的噪声估计。Noise estimation is a fundamental part of speech enhancement.Most traditional methods are heuristic which can not enable the optimal estimation.An unsupervised noise power estimation is presented based on maximum likelihood.A log-power statistical model is constructed using hidden Markov model(HMM)in each subband.This model comprises speech and nonspeech Gauss components,and the mean value of nonspeech Gauss component is the estimation of noise power.Moreover,speech may be long-term absent,some constraints are introduced to this model for stability.The experiments validate that the proposed method can obtain the maximum likelihood noise estimation and outperforms conventional heuristic methods.

关 键 词:语音增强 噪声功率谱估计 隐马尔可夫模型 极大似然准则 模型约束 

分 类 号:TN912.3[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象