基于域对抗迁移学习的低资源机器翻译  

Domain-adversarial Transfer Learning for Low-resource Neural Machine Translation

在线阅读下载全文

作  者:常鑫 侯宏旭[1] 乌尼尔 贾晓宁 李浩然 CHANG Xin;HOU Hongxu;WU Nier;JIA Xiaoning;LI Haoran(School of Computer Technology,Inner Mongolia University,Hohhot,Inner Mongolia 010021,China)

机构地区:[1]内蒙古大学计算机学院,内蒙古呼和浩特010021

出  处:《中文信息学报》2024年第6期77-85,共9页Journal of Chinese Information Processing

基  金:内蒙古自治区科技成果转化专项(2019CG028);内蒙古自然科学基金(2018MS06005,14020202-0114)。

摘  要:当域外和域内分别表示不同的语言时,语言之间的差异会导致域外知识难以适应至域内。因此提出域对抗迁移学习方法来改进机器翻译模型。采用对抗学习方法,加入一个域判别器对域外和域内的语义特征进行预测,通过最小化域外和域内语义特征预测值优化编码器。当两个领域的语义特征预测值相近时,说明模型学习到一个可以把域内数据映射到域外的映射函数。通过实验,该方法在蒙古语-汉语和维吾尔语-汉语等翻译任务上展现出一定的泛化能力。When the out-of-domain and in-domain represent different languages,the differences between languages will make it difficult adapt the out-of-domain knowledge to the in-domain.This paper proposes a domain-adversarial transfer learning method to improve the neural machine translation model.Under the adversarial learning framework,a domain discriminator is employed to predict the semantic features that from out-of-domain or in-domain,and the encoder is optimized by minimizing the prediction values of the semantic features.When the predicted values of semantic features in the two domains are similar,it means that the model has learned the mapping function that can transfer in-domain data into out-of-domain.Experiments show a certain generalization ability of this method on Mongolian-Chinese and Uyghur-Chinese translation tasks.

关 键 词:对抗 机器翻译 多语言 对抗学习 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象