一种基于短语的汉蒙统计机器翻译与调序模型  被引量:3

A phrase based statistical Chinese-Mongolian machine translation and reordering model

在线阅读下载全文

作  者:侯宏旭[1,2,3] 刘群[2] 李锦涛[2] 

机构地区:[1]内蒙古大学计算机学院,呼和浩特010021 [2]中国科学院计算技术研究所,北京100190 [3]中国科学院研究生院,北京100190

出  处:《高技术通讯》2009年第5期475-479,共5页Chinese High Technology Letters

基  金:973计划(2007CB316503);内蒙古自然基金(200607010805)资助项目

摘  要:根据蒙古语的一些特点,为基于短语的汉蒙统计机器翻译提出了一种适合于汉蒙统计机器翻译的调序模型,并给出了相应的训练和解码算法以及初步实验的结果。汉蒙双语语料库规模很小,数据稀疏问题严重,而在汉蒙翻译中,词序变化又非常明显,在汉英等机器翻译中使用的调序方法难于应用到汉蒙统计机器翻译中。通过对汉蒙翻译过程中词语顺序变化的正态分布假设,建立了一种概率调序模型。实验表明,这种概率调序模型好于 Moses系统中采用的调序方法。Based on the phrase-based statistical Chinese-Mongolian machine translation, an ordering model is put forward according to the Mongolian features, together with the corresponding drills, the decoding algorithm as well as the results of the primary experiments. Currently, the Chinese-Mongolian bilingual corpus is on a relatively small scale and its data are seriously sparse. In addition, the word order changes are dramatic and prevalent in Chinese-Mongolian translations. Consequently, the reordering method used in Chinese-English translation can not be optimally applied to the Chinese-Mongolian translation. By the assumption of the normal distribution of word-order changes after the analyses of these changes in Chinese-Mongolian translations, a probabilistic reordering model is established in the paper. According to the experimental results, the probabilistic model is superior to the ordering method in the Moses.

关 键 词:机器翻译 统计方法 蒙古语 调序 概率 

分 类 号:TP391.2[自动化与计算机技术—计算机应用技术] TP212[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象