检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:曹中辉 黄志华[1] 葛文萍[1] 黄浩[1] CAO Zhonghui;HUANG Zhihua;GE Wenping;HUANG Hao(College of Information Science and Engineering,Key Laboratory of Signal Detection and Processing in Xinjiang Uygur Autonomous Region,Xinjaing University,Urumqi 830001,Xinjiang,China)
机构地区:[1]新疆大学信息科学与工程学院,信号检测与处理新疆维吾尔自治区重点实验室,新疆乌鲁木齐830001
出 处:《声学技术》2021年第1期77-81,共5页Technical Acoustics
基 金:新疆维吾尔自治区自然科学基金项目资助(2017D01C044)。
摘 要:基于深度学习的语音增强模型对训练集外语言语音和噪声进行降噪时,性能明显下降。为了解决这一问题,提出一种引入注意力机制的生成对抗网络(Generative Adversarial Network,GAN)语音增强迁移学习模型。在生成对抗语音增强模型的判别模型中引入注意力机制,以高资源场景下的大量语音数据训练得到的语音增强模型为基础增强模型,结合低资源场景下的少量语音训练数据,对基础增强模型进行权重迁移,提升低资源场景下语音增强模型的增强效果。实验结果表明,采用注意力机制的生成对抗语音增强迁移学习模型,对低资源场景下的带噪语音和集外噪声可以进行有效的降噪。The deep learning based speech enhancement model encounters the problem of enhancement performance degradation when de-noising the unseen languages and noise in training sets.In order to solve this problem,a generative adversarial network(GAN)speech enhancement transfer learning model with attention mechanism(called ATGAN speech enhancement model)is proposed in this paper.The attention mechanism is introduced into the discriminator of GAN speech enhancement model.Based on the well-trained model obtained with high-resource materials and combining a small amount of speech training data in low-resource condition,the weight transfer of the basic enhancement model trained with low-resource data is carried out to improve the enhancement effect in low-resource condition.Experiments show that the use of ATGAN speech enhancement model can effectively enhance the denoising effect of low-resource noisy speech.
关 键 词:生成对抗网络(GAN) 语音增强 迁移学习 跨语言语音增强 注意力机制
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.15.220.106