联合长短时记忆递归神经网络和非负矩阵分解的语音混响消除方法  被引量:11

A Research to Speech Dereverberation Method Based on BLSTM Recurrent Neural Networks and Non-negative Matrix Factorization

在线阅读下载全文

作  者:刘斌[1] 陶建华[1,2,3] 

机构地区:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100190 [2]中国科学院脑科学与智能技术卓越创新中心,北京100190 [3]中国科学院大学计算机与控制学院,北京100190

出  处:《信号处理》2017年第3期268-272,共5页Journal of Signal Processing

基  金:中国国家高技术研究发展计划(863计划)(2015AA016305);国家自然科学基金(61425017;61403386;61305003;61233009;61273288);国家社会科学基金重大项目(13&ZD189);中国科学院先导专项(Grant XDB02080006)

摘  要:本文提出了一种联合长短时记忆递归神经网络和非负矩阵分解方法对单通道语音进行混响消除;对语音信号的对数功率谱建模抑制混响干扰。首先通过长短时记忆递归神经网络估计对数功率谱,这种模型结构能捕获整个音频序列的信息重构纯净语音的对数功率谱,然后通过非负矩阵分解方法对重构的对数功率谱进行后处理抑制过平滑问题;实验结果表明所提方法可以有效抑制语音信号中的混响干扰,本文方法的各种性能指标优于基线方法。This paper presents a two stages speech dereverberation method which combine the bidirectional Long Short Term Memory( BLSTM) recurrent neural network with non-negative matrix factorization( NMF) for a single channel. The log power spectra is selected as features to suppress the reverberation. The BLSTM-RNN which can capture information from anywhere in the feature sequence is used to dereverberated log power spectra firstly and NMF which could alleviate the oversmoothing problem is applied to generated log power spectra in the second stage. Experimental results demonstrate that the proposed method could achieve significant improvements over the different baseline methods.

关 键 词:单通道混响消除 长短时记忆递归神经网络 非负矩阵分解 深度学习 

分 类 号:TN912[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象