基于门控循环神经网络词性标注的蒙汉机器翻译研究  被引量:3

Mongolian-Chinese Machine Translation Research Based on Part of Speech Tagging with Gated Unit Neural Network

在线阅读下载全文

作  者:刘婉婉[1] 苏依拉[1] 乌尼尔[1] 仁庆道尔吉[1] LIU Wanwan;SU Yila;Wunier;Renqingdaoerji(Inner Mongolia University of Technology,College of Information Engineering,Hohhot,Inner Mongolia 010080,China)

机构地区:[1]内蒙古工业大学信息工程学院,内蒙古呼和浩特010080

出  处:《中文信息学报》2018年第8期68-74,共7页Journal of Chinese Information Processing

基  金:国家自然科学基金(61363052;61502255);内蒙古自治区自然科学基金(2016MS0605);内蒙古自治区民族事务委员会基金(MW-2017-MGYWXXH-03)

摘  要:统计机器翻译可以通过统计方法预测出目标词,但没有充分理解原文语义关系,因而得到的译文质量不高。针对该问题,利用一种基于门控单元循环神经网络结构来对蒙汉神经机器翻译系统进行建模,引入注意力机制来获取双语词语的对齐信息,并在构建字典过程中对双语词语进行词性标注来强化语义,以此来缓解因欠训练导致的错译问题。实验结果表明,与RNN的基准系统和传统的统计机器翻译方法相比,该方法 BLEU值得到一定的提升。Statistics machine translation may be able to predict a relatively accurate target word with statistical analysis method,but it cannot get a much better translation as it couldn't fully understand the original semantic relations.To address this problem,the model of Mongolian-Chinese machine translation system is constructed using gated unit recurrent neural network structure,and introduce the global attention mechanism to obtain bilingual alignment information.In the process of constructing a dictionary,the bilingual words are annotated to strengthen the semantics,alleviating the problem caused by erroneous training.The research result shows that the BLEU value is certainly promoted and improved compared with previous benchmark research and traditional statistical machine translation method.

关 键 词:机器翻译 门控循环神经网络 注意力机制 对齐 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象