检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:侯宏旭[1] 刘群[1] 刘志文[2] 张国强[2]
机构地区:[1]中科院计算技术实验室智能信息处理重点实验室,北京100080 [2]内蒙古大学计算机学院,呼和浩特010021
出 处:《内蒙古大学学报(自然科学版)》2008年第2期220-224,共5页Journal of Inner Mongolia University:Natural Science Edition
基 金:内蒙古自然基金项目“蒙古语文本语言模型的构建研究”(200607010805);国家自然基金项目“基于短语结构转换模板的统计机器翻译方法研究”(60573188)资助
摘 要:蒙古文具有典型的构词词缀的特点,一个词往往可以切分成词干和词缀等若干个部分.如果采用通常的N-gram语言模型很难描述词干、词缀等的长距离依赖关系.提出了一种利用长距离依赖的Skip-N语言模型,给出了相隔N个词的二元依赖关系.对这种方法进行了实现,并在一个基于实例的汉蒙机器翻译系统上进行了实验,实验证明Skip-N语言模型能够有效地提高汉蒙机器翻译的效果.Etymas and suffixes are the typical characters of Mongolian. A Mongolian word could usually be divided into an etyma and several suffixes. It is difficult to describe the dependent relationship of long distance between an etyma and suffixes if using the N-gram language model. Based on long-distance dependence ,a new kind of language model called Skip-N model is presented, and the relation of N-word separated bigram dependence is given. The technique is realized, to applied to a Chinese-Mongolian machine translation system. The experiments prove that the Skip-N language model can improve the translation result.
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.124