检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:乌尼尔[1] 苏依拉[1] 刘婉婉[1] 仁庆道尔吉[1] Wunier;Suyila;LIU Wanwan;REN qingdaoerji(College of Information Engineering,Inner Mongolia University of Technology,Hohhot,Inner Mongolia 010080,China)
机构地区:[1]内蒙古工业大学信息工程学院,内蒙古呼和浩特010080
出 处:《中文信息学报》2018年第5期42-48,共7页Journal of Chinese Information Processing
基 金:国家自然科学基金(61363052;61502255);内蒙古自治区自然科学基金(2016MS0605);内蒙古自治区民族事务委员会基金(MW-2017-MGYWXXH-03)
摘 要:随着科学技术的发展,以循环神经网络为基础的机器翻译方法由于翻译质量更好而逐渐取代统计机器翻译方法,特别是在国际大语种之间的互译方面,RNN在对语料编码时能够提取更好的特征,这对翻译质量好坏至关重要。然而在蒙古语这类小语种的翻译方面,由于语料不足导致的数据稀疏和RNN模型训练梯度消失等问题,很难从语料中充分获取语义关系,因此该文提出一种基于卷积神经网络CNN(convolutional neural network)的蒙汉机器翻译方法,在对源语料编码时利用池化层获取语义关系,并根据蒙古语构词特点得到句子的语义信息,再通过融合全局注意力机制的GRU循环神经网络将编码过后的源语言解码为汉语。实验结果表明,该方法在翻译准确率和训练速度两方面均优于RNN基准机器翻译方法。The machine translation based on recurrent neural network is gradually replacing the statistical machine translation,especially between the major languages in the world.I Due to the shortage of Mongolian corpus,a method of Mongolian-Chinese machine translation based on Convolutional Neural Network is proposed.In the process of encoding the source corpus,through the pooling layer,the semantic relation and information of CNN in the sentence can be obtained according to the characteristics of Mongolian word formation.The experimental result shows that the method outperforms RNN NMT in the aspect of the quality and training speed of the translation.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.71