汉文-维吾尔文双语语料库中基于词典译文的句子对齐方法研究  被引量:4

Research on Dictionary Based Sentense Alignment Method in Chinese and Uighur Bilingual Corpus

在线阅读下载全文

作  者:热西旦.塔依 吐尔根.依布拉音 

机构地区:[1]伊犁师范学院计算机科学系,新疆伊犁835000 [2]新疆大学信息科学与工程学院,新疆乌鲁木齐830046

出  处:《新疆大学学报(自然科学版)》2009年第3期359-363,共5页Journal of Xinjiang University(Natural Science Edition)

基  金:国家自然科学基金资助(编号:60663006);新疆维吾尔自治区高新技术计划项目(200712109)

摘  要:双语语料库的自动对齐已成为机器翻译研究中一个十分重要的研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,本文根据汉文-维吾尔文的特点,在分析目前双语句子对齐方法的基础上,提出了基于译文的对齐方法,通过使用一部翻译较完整的词典作为桥梁,将汉维句子关联起来.根据维吾尔语文本中的单词,在词典中找到其对应的译文,并将译文到汉语句子中去匹配,根据评价函数和动态规划算法找到对齐句对.Parallel corpora alignment is an important research issue in Machine Translation. The current sentence alignment methods include length-based and lexicon-based methods. This paper, based on the characters of Chinese and Uighur language, analyses the existing alignment methods and proposes translation-based method: With a dictionary as the bridge, corresponding translation of the words in Uighur text are found in the dictionary and then matched with the translation of Chinese text. The aligned sentences are determined according to an evaluating function and the dynamic programming algorithm.

关 键 词:汉文 维吾尔文 机器翻译 句子对齐 双语语料库 

分 类 号:TP317.3[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象