具有选择注意能力的语音拾取技术  被引量:4

Speech-picking for speech systems with auditory attention ability

在线阅读下载全文

作  者:王晓飞[1] 国雁萌[1] 葛凤培[1] 吴超[1] 付强[1] 颜永红[1] 

机构地区:[1]中国科学院声学研究所中国科学院语言声学与内容理解重点实验室,北京100190

出  处:《中国科学:信息科学》2015年第10期1310-1327,共18页Scientia Sinica(Informationis)

基  金:国家自然科学基金项目(批准号:11161140319);中国科学院战略性先导科技专项(批准号:XDA06030100;XDA06030500);国家高技术研究发展计划(863计划)项目(批准号:2012AA012503);中国科学院重点部署项目(批准号:KGZD-EW-103-2)资助

摘  要:随着语音通信和人机语音交互系统的不断普及,人们越来越期待抛开话筒和耳机等繁琐的设备,实现像人类对话一般自然的人机语音交流.然而,语音毕竟只是一种声波,在空气中传输时难免受到各种影响,例如声波的衰减、墙壁和障碍物的多次反射以及同时存在的其他声源等.如果不采用近讲的拾音方式,那么这些因素都会对传播中的语音声波造成干扰.特别是当多个语音系统和多个说话人处于同一环境时,如何确保系统正确接收语音信息,决定了语音系统能否走向实用.本文参考人类的听觉注意机理,提出充分利用对目标语音及干扰声源的先验知识,检测和提升目标语音,并通过将传声器阵列、语音唤醒、目标语音检测、语音增强、混响抑制等一系列技术相结合,实现抗干扰的目标语音拾取.Currently, a natural speech-picking mode is badly needed in speech communication and in humancomputer interaction systems. However, speech is usually corrupted by attenuation, multi-path propagation, and various interferences before it is received, especially when there exist several speech systems and users. It is important for practical speech systems to pick the correct speech signal within complex environments. In this paper, the mechanism of auditory attention ability is simulated through a target speech-picking system in which the a priori knowledge of the target speech and interference of sound sources are used carefully to detect and improve the target speech. The technologies of microphone arrays, wake-up-words, target speech detection, speech enhancement, and dereverberation are combined in this strategy to fulfill the task of robust target speech-picking.

关 键 词:传声器阵列 唤醒词 声学回波控制 语音增强 目标语音检测 混响抑制 

分 类 号:TN912.3[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象