检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:董兴华[1] 周俊林[2] 郭树盛[1] 吐尔洪.吾司曼
机构地区:[1]中国科学院新疆理化技术研究所,乌鲁木齐830011 [2]中国科学院新疆分院,乌鲁木齐830011
出 处:《计算机工程》2011年第9期16-18,21,共4页Computer Engineering
基 金:中国科学院西部行动计划高新技术基金资助项目(KGCX2-YW-507)
摘 要:利用电话录音的汉维平行语料库和开源的Moses系统构建一个基于短语的统计机器翻译系统。针对汉维平行语料库规模较小和维吾尔语形态变化比较丰富的特点,通过对词级的语料库进行切分得到词素级的语料库,并分别进行词一级的实验和词素级的实验。实验表明,词素级的实验能降低无法识别的词的概率,提高翻译的质量。This paper gives a description of implementing a phrase-based machine translation system for Chinese-Uyghur,by the Moses toolkit,using a parallel corpus which is based on telephone recording.For the small scale parallel corpus and highly-inflected characteristics for Uyghur,it splits the Uyghur words into morphemes,and it gets another parallel corpus on morpheme-level.Experiments are carried out on word-level and morpheme-level separately,and show it can reduce the probability of Out-Of-Vocabulary(OOV) and improve the translation quality.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249