一种哈萨克语句子相似度计算方法的研究  被引量:3

Research of a Method for Kazakh Sentence Simi1arity Computing

在线阅读下载全文

作  者:江阿古丽.哈依达尔 卡哈尔江.阿比的热西提 阿里木江.亚森 吐尔根.依布拉音 艾山.吾买尔[1,2] 

机构地区:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830046 [2]新疆大学多语种信息处理重点实验室,新疆乌鲁木齐830046 [3]上海交通大学计算机科学与工程系,上海200240 [4]新疆信息产业有限责任公司,新疆乌鲁木齐830026

出  处:《新疆大学学报(自然科学版)》2012年第4期471-474,479,共5页Journal of Xinjiang University(Natural Science Edition)

基  金:国家电子信息产业发展基金项目-维哈柯语言文字软件开发及产业化之维哈柯文辅助翻译与电子词典软件(财建[2009]537;工信部财[2009]453);国家自然科学基金(60963018;61063026);新疆大学博士科研科研启动基金;新疆大学多语种信息技术重点实验室开放课题

摘  要:句子相似度计算是基于实例机器翻译的主要方法.对基于实例的哈萨克语机器翻译,哈萨克语句子相似度衡量的准确性直接影响到最终翻译结果.哈萨克语是粘着型语言,具有丰富的构型和构词附加成分,词干正确提取可以很大程度上提高自然语言处理的效率.本文主要提出一种基于词干提取的哈萨克语句子相似度计算方法,即对计算相似度句子中的词语先进行词干提取,再进行相似度计算.此方法试验结果表明,其相似度有了较大的提高,进而基于实例的机器翻译系统的准确性也得到了相应的提高.Sentence similarity computing is the main method of EBMT. Based on the examples of the Kazakh machine translation, the Kazakh sentence similarity measure veracity directly affect the final result of translating. The Kazakh agglutinativelanguage, with rich configuration and morphological additional ingredients, the correct extraction of the stemming can significantly improve the efficiency of natural language processing. This paper presents a method based on stemming the Kazakh sentence similarity computing method, calculation of similarity in the treatment of the word first stemming, and then calculated similarity computing method. Using this method on the attempt of the results showed that the similarity is distinctly improved, and then the corresponding example based machine translation system accuracy is improved.

关 键 词:EBMT 哈萨克语 句子相似度 词干提取 

分 类 号:TP391.2[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象