基于空间声场扩散信息的混响抑制方法  

Reverberation suppression method based on diffuse information in a room sound field

在线阅读下载全文

作  者:王晓飞[1] 姜开宇[1] 国雁萌[1] 付强[1] 颜永红[1] 

机构地区:[1]中国科学院声学研究所,语言声学与内容理解重点实验室,北京100190

出  处:《清华大学学报(自然科学版)》2013年第6期917-920,共4页Journal of Tsinghua University(Science and Technology)

基  金:国家自然科学基金项目(10925419;90920302;61271426;61072124;11074275;11161140319;91120001);中国科学院战略性先导科技专项(XDA06030100;XDA06030500);国家"八六三"高技术项目(2012AA012503);中科院重点部署项目(KGZD-EW-103-2)

摘  要:在远讲语音应用中,房间混响严重影响了语音的质量和主观听觉感受。该文利用双通道混响语音信号,根据语音直达声和混响声所反映出的声场扩散信息,提出一种基于空间声场扩散信息的时频递归平均混响功率谱估计方法,并通过谱增强的方法实现对混响的有效抑制。该文提出的算法在实录房间冲击响应(room impulse response,RIR)上实现了混响环境中语音增强,算法在分段信混比(segmental signal-to-reverberation ratio,SSRR)、对数谱距离(log spec-tral distortion,LSD)以及主观语音质量评估(perceptual e-valuation of speech quality-mean opinion score,PESQ-MOS)方面都表现出性能的提升。Reverberation suppression can be used to improve speech quality and subjective hearing responses.This article describes a method to estimate the power spectrum of reverberation from reverberated signals of dual microphones based on diffuse information in the room sound field.This method takes full advantage of diffuse information reflected by direct sounds and reverberated sounds for speech enhancement.The system performance is evaluated based on indexes for the segmental signal-to-reverberation ratio(SSRR),log spectrum distance(LSD) and perceptual evaluation of speech quality-mean opinion score(PESQ-MOS) based on actual room impulse responses with the results showing the sound quality improvement.

关 键 词:语音增强 混响抑制 声场扩散信息 功率谱 

分 类 号:TN912.3[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象