注意力机制对生成对抗网络语音增强迁移学习模型的影响  被引量:2

Influence of attention mechanism on generative adversarial network speech enhancement transfer learning model

在线阅读下载全文

作  者:曹中辉 黄志华[1] 葛文萍[1] 黄浩[1] CAO Zhonghui;HUANG Zhihua;GE Wenping;HUANG Hao(College of Information Science and Engineering,Key Laboratory of Signal Detection and Processing in Xinjiang Uygur Autonomous Region,Xinjaing University,Urumqi 830001,Xinjiang,China)

机构地区:[1]新疆大学信息科学与工程学院,信号检测与处理新疆维吾尔自治区重点实验室,新疆乌鲁木齐830001

出  处:《声学技术》2021年第1期77-81,共5页Technical Acoustics

基  金:新疆维吾尔自治区自然科学基金项目资助(2017D01C044)。

摘  要:基于深度学习的语音增强模型对训练集外语言语音和噪声进行降噪时,性能明显下降。为了解决这一问题,提出一种引入注意力机制的生成对抗网络(Generative Adversarial Network,GAN)语音增强迁移学习模型。在生成对抗语音增强模型的判别模型中引入注意力机制,以高资源场景下的大量语音数据训练得到的语音增强模型为基础增强模型,结合低资源场景下的少量语音训练数据,对基础增强模型进行权重迁移,提升低资源场景下语音增强模型的增强效果。实验结果表明,采用注意力机制的生成对抗语音增强迁移学习模型,对低资源场景下的带噪语音和集外噪声可以进行有效的降噪。The deep learning based speech enhancement model encounters the problem of enhancement performance degradation when de-noising the unseen languages and noise in training sets.In order to solve this problem,a generative adversarial network(GAN)speech enhancement transfer learning model with attention mechanism(called ATGAN speech enhancement model)is proposed in this paper.The attention mechanism is introduced into the discriminator of GAN speech enhancement model.Based on the well-trained model obtained with high-resource materials and combining a small amount of speech training data in low-resource condition,the weight transfer of the basic enhancement model trained with low-resource data is carried out to improve the enhancement effect in low-resource condition.Experiments show that the use of ATGAN speech enhancement model can effectively enhance the denoising effect of low-resource noisy speech.

关 键 词:生成对抗网络(GAN) 语音增强 迁移学习 跨语言语音增强 注意力机制 

分 类 号:H107[语言文字—汉语]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象