融合单语语言模型的藏汉机器翻译方法研究  被引量:5

Tibetan-Chinese Machine Translation Based on Tibetan Language Model Enhanced Transformer

在线阅读下载全文

作  者:慈祯嘉措 桑杰端珠 孙茂松[3] 色差甲 周毛先[1,2] CIZHEN Jiacuo;SANGJIE Duanzhu;SUN Maosong;SE Chajia;ZHOU Maoxian(MOE Key Laboratory of Tibetan Information Processing,Qinghai Normal University,Xining,Qinghai 810008,China;Provincial Key Laboratory of Tibetan Intelligent Information Processing and Machine Translation,Xining,Qinghai 810008,China;Department of Computer Science,Tsinghua University,Beijing 100084,China)

机构地区:[1]青海师范大学藏文信息处理教育部重点实验室,青海西宁810008 [2]青海省藏文信息处理与机器翻译重点实验室,青海西宁810008 [3]清华大学计算机系,北京100084

出  处:《中文信息学报》2019年第12期61-66,共6页Journal of Chinese Information Processing

基  金:国家自然科学基金(61063033,61662061);国家重点研发计划(2017YFB1402200)

摘  要:由于藏汉平行语料匮乏,导致藏汉神经网络机器翻译效果欠佳,该文提出了一种将藏语单语语言模型融合到藏汉神经网络机器翻译的方法,首先利用神经网络实现藏语单语语言模型,然后使用Transformer实现藏汉神经网络机器翻译模型,最后将藏语单语语言模型融合到藏汉神经网络机器翻译中。实验表明,该方法能显著提升藏汉神经网络机器翻译质量。基线系统藏语到汉语的BLEU值为21.1,汉语到藏语的BLEU值为18.6,融合藏语单语语言模型后,藏语到汉语的BLEU值为24.5,汉语到藏语的BLEU值为23.3,比原有基线系统的BLEU值分别提高了3.4和4.7。To better utilize the monolingual Tibetan texts in Tibetan-Chinese neural machine translation(NMT),we propose to pre-train a Tibetan neural language model and then integrate it into a Transformer-based Tibetan-Chinese NMT model.Experiments indicate our approach can boost the Tibetan-Chinese results from 21.1 to 24.5,and the Chinese-Tibetan form 18.6 to 23.3 in terms of BLEU score.

关 键 词:藏语 语言模型 机器翻译 融合 神经网络 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象