检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:江阿古丽.哈依达尔 卡哈尔江.阿比的热西提 阿里木江.亚森 吐尔根.依布拉音 艾山.吾买尔[1,2]
机构地区:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830046 [2]新疆大学多语种信息处理重点实验室,新疆乌鲁木齐830046 [3]上海交通大学计算机科学与工程系,上海200240 [4]新疆信息产业有限责任公司,新疆乌鲁木齐830026
出 处:《新疆大学学报(自然科学版)》2012年第4期471-474,479,共5页Journal of Xinjiang University(Natural Science Edition)
基 金:国家电子信息产业发展基金项目-维哈柯语言文字软件开发及产业化之维哈柯文辅助翻译与电子词典软件(财建[2009]537;工信部财[2009]453);国家自然科学基金(60963018;61063026);新疆大学博士科研科研启动基金;新疆大学多语种信息技术重点实验室开放课题
摘 要:句子相似度计算是基于实例机器翻译的主要方法.对基于实例的哈萨克语机器翻译,哈萨克语句子相似度衡量的准确性直接影响到最终翻译结果.哈萨克语是粘着型语言,具有丰富的构型和构词附加成分,词干正确提取可以很大程度上提高自然语言处理的效率.本文主要提出一种基于词干提取的哈萨克语句子相似度计算方法,即对计算相似度句子中的词语先进行词干提取,再进行相似度计算.此方法试验结果表明,其相似度有了较大的提高,进而基于实例的机器翻译系统的准确性也得到了相应的提高.Sentence similarity computing is the main method of EBMT. Based on the examples of the Kazakh machine translation, the Kazakh sentence similarity measure veracity directly affect the final result of translating. The Kazakh agglutinativelanguage, with rich configuration and morphological additional ingredients, the correct extraction of the stemming can significantly improve the efficiency of natural language processing. This paper presents a method based on stemming the Kazakh sentence similarity computing method, calculation of similarity in the treatment of the word first stemming, and then calculated similarity computing method. Using this method on the attempt of the results showed that the similarity is distinctly improved, and then the corresponding example based machine translation system accuracy is improved.
分 类 号:TP391.2[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.139.64.42