检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]伊犁师范学院计算机科学系,新疆伊犁835000 [2]新疆大学信息科学与工程学院,新疆乌鲁木齐830046
出 处:《新疆大学学报(自然科学版)》2009年第3期359-363,共5页Journal of Xinjiang University(Natural Science Edition)
基 金:国家自然科学基金资助(编号:60663006);新疆维吾尔自治区高新技术计划项目(200712109)
摘 要:双语语料库的自动对齐已成为机器翻译研究中一个十分重要的研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,本文根据汉文-维吾尔文的特点,在分析目前双语句子对齐方法的基础上,提出了基于译文的对齐方法,通过使用一部翻译较完整的词典作为桥梁,将汉维句子关联起来.根据维吾尔语文本中的单词,在词典中找到其对应的译文,并将译文到汉语句子中去匹配,根据评价函数和动态规划算法找到对齐句对.Parallel corpora alignment is an important research issue in Machine Translation. The current sentence alignment methods include length-based and lexicon-based methods. This paper, based on the characters of Chinese and Uighur language, analyses the existing alignment methods and proposes translation-based method: With a dictionary as the bridge, corresponding translation of the words in Uighur text are found in the dictionary and then matched with the translation of Chinese text. The aligned sentences are determined according to an evaluating function and the dynamic programming algorithm.
分 类 号:TP317.3[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.16.70.193