具有选择注意能力的语音拾取技术被引量：4

Speech-picking for speech systems with auditory attention ability

作　　者：王晓飞[1] 国雁萌[1] 葛凤培[1] 吴超[1] 付强[1] 颜永红[1]

机构地区：[1]中国科学院声学研究所中国科学院语言声学与内容理解重点实验室,北京100190

出　　处：《中国科学：信息科学》2015年第10期1310-1327,共18页Scientia Sinica(Informationis)

基　　金：国家自然科学基金项目(批准号:11161140319);中国科学院战略性先导科技专项(批准号:XDA06030100;XDA06030500);国家高技术研究发展计划(863计划)项目(批准号:2012AA012503);中国科学院重点部署项目(批准号:KGZD-EW-103-2)资助

摘　　要：随着语音通信和人机语音交互系统的不断普及,人们越来越期待抛开话筒和耳机等繁琐的设备,实现像人类对话一般自然的人机语音交流.然而,语音毕竟只是一种声波,在空气中传输时难免受到各种影响,例如声波的衰减、墙壁和障碍物的多次反射以及同时存在的其他声源等.如果不采用近讲的拾音方式,那么这些因素都会对传播中的语音声波造成干扰.特别是当多个语音系统和多个说话人处于同一环境时,如何确保系统正确接收语音信息,决定了语音系统能否走向实用.本文参考人类的听觉注意机理,提出充分利用对目标语音及干扰声源的先验知识,检测和提升目标语音,并通过将传声器阵列、语音唤醒、目标语音检测、语音增强、混响抑制等一系列技术相结合,实现抗干扰的目标语音拾取.Currently, a natural speech-picking mode is badly needed in speech communication and in humancomputer interaction systems. However, speech is usually corrupted by attenuation, multi-path propagation, and various interferences before it is received, especially when there exist several speech systems and users. It is important for practical speech systems to pick the correct speech signal within complex environments. In this paper, the mechanism of auditory attention ability is simulated through a target speech-picking system in which the a priori knowledge of the target speech and interference of sound sources are used carefully to detect and improve the target speech. The technologies of microphone arrays, wake-up-words, target speech detection, speech enhancement, and dereverberation are combined in this strategy to fulfill the task of robust target speech-picking.

关键词：传声器阵列唤醒词声学回波控制语音增强目标语音检测混响抑制

分类号：TN912.3[电子电信—通信与信息系统]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

具有选择注意能力的语音拾取技术被引量：4

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

具有选择注意能力的语音拾取技术 被引量：4

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

具有选择注意能力的语音拾取技术被引量：4