检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王先宇 张二华[1] WANG Xianyu;ZHANG Erhua(School of Computer Science and Engineering,Nanjing University of Science and Technology,Nanjing 210094)
机构地区:[1]南京理工大学计算机科学与工程学院,南京210094
出 处:《计算机与数字工程》2022年第9期2037-2041,共5页Computer & Digital Engineering
摘 要:近年来,随着深度神经网络技术的发展,人们提出了越来越多的深层网络结构并将其应用于语音分离任务。本文基于长短时记忆模型,研究了一种信噪分离算法,将梅尔频率倒谱系数作为模型的输入进行掩蔽估计,用Griffin-Lim算法重构分离语音。实验表明该算法的分离效果相比CNN方法有明显的提升,对阵发性噪声的分离效果尤其明显.With the deep neural network technique development in recent years,increasing numbers of deep neural network structures have been proposed and widely used in speech separation. This paper studies a speech separation algorithm based on LSTM which takes MFCC as the input to carry out masking mask estimation and Griffin-Lim Signal Estimation Algorithm is used to reconstruct the separated speech. Experiment shows an obvious promotion in separation results comparing with CNN method,the separation effect of paroxysmal noise is especially obvious.
关 键 词:信噪分离 深度神经网络 Griffin-Lim算法 长短时记忆模型
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28