检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王晓飞[1] 国雁萌[1] 葛凤培[1] 吴超[1] 付强[1] 颜永红[1]
机构地区:[1]中国科学院声学研究所中国科学院语言声学与内容理解重点实验室,北京100190
出 处:《中国科学:信息科学》2015年第10期1310-1327,共18页Scientia Sinica(Informationis)
基 金:国家自然科学基金项目(批准号:11161140319);中国科学院战略性先导科技专项(批准号:XDA06030100;XDA06030500);国家高技术研究发展计划(863计划)项目(批准号:2012AA012503);中国科学院重点部署项目(批准号:KGZD-EW-103-2)资助
摘 要:随着语音通信和人机语音交互系统的不断普及,人们越来越期待抛开话筒和耳机等繁琐的设备,实现像人类对话一般自然的人机语音交流.然而,语音毕竟只是一种声波,在空气中传输时难免受到各种影响,例如声波的衰减、墙壁和障碍物的多次反射以及同时存在的其他声源等.如果不采用近讲的拾音方式,那么这些因素都会对传播中的语音声波造成干扰.特别是当多个语音系统和多个说话人处于同一环境时,如何确保系统正确接收语音信息,决定了语音系统能否走向实用.本文参考人类的听觉注意机理,提出充分利用对目标语音及干扰声源的先验知识,检测和提升目标语音,并通过将传声器阵列、语音唤醒、目标语音检测、语音增强、混响抑制等一系列技术相结合,实现抗干扰的目标语音拾取.Currently, a natural speech-picking mode is badly needed in speech communication and in humancomputer interaction systems. However, speech is usually corrupted by attenuation, multi-path propagation, and various interferences before it is received, especially when there exist several speech systems and users. It is important for practical speech systems to pick the correct speech signal within complex environments. In this paper, the mechanism of auditory attention ability is simulated through a target speech-picking system in which the a priori knowledge of the target speech and interference of sound sources are used carefully to detect and improve the target speech. The technologies of microphone arrays, wake-up-words, target speech detection, speech enhancement, and dereverberation are combined in this strategy to fulfill the task of robust target speech-picking.
关 键 词:传声器阵列 唤醒词 声学回波控制 语音增强 目标语音检测 混响抑制
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.134.81.178