检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:钱丽萍[1] 赵铁军[2] 杨沫昀[2] 高光来[3]
机构地区:[1]安徽财贸学院计算机系,合肥233041 [2]哈尔滨工业大学计算机系,哈尔滨150001 [3]内蒙古大学计算机学院,呼和浩特010021
出 处:《计算机工程与应用》2000年第12期59-61,共3页Computer Engineering and Applications
基 金:863-306资助!合同号为863-306-ZD03-03-2.
摘 要:双语语料库的自动对齐已成为机器翻译研究中的一个重要研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,该文先分析了基于长度的方法,然后提出了基于译文的方法:通过使用一部翻译较完整的词典作为桥梁,把英汉句子之间的对应关系连接起来.根据英语文本中的单词,在词典中找到其对应的译文,并以译文到汉语句子中去匹配,根据评价函数和动态规划算法找到对齐句对.实验结果证明这种对齐方法消除了基于长度做法中错误蔓延的情况,它大大地提高了对齐的精度,其效果是令人满意的.Parallel corpora alignment is a important research issue in MT.The current sentence alignment methods include length-based and lexicon-based methods.This paper analyses length-based method and proposes translation-based method:With a dictionary as the bridge,corresponding translation of the words in English text are found in the dictionary and then matched with the translation of Chinese text.The alignment sentences are determined according to an evaluating function and the dynamic programming algorithm.The experimental result shows that this new method greatly improves the precision of sentence alignment.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.200