基于译文的英汉双语句子自动对齐  被引量:12

Translation-Based Automatic Alignment of English and Chinese Parallel Corpora

在线阅读下载全文

作  者:钱丽萍[1] 赵铁军[2] 杨沫昀[2] 高光来[3] 

机构地区:[1]安徽财贸学院计算机系,合肥233041 [2]哈尔滨工业大学计算机系,哈尔滨150001 [3]内蒙古大学计算机学院,呼和浩特010021

出  处:《计算机工程与应用》2000年第12期59-61,共3页Computer Engineering and Applications

基  金:863-306资助!合同号为863-306-ZD03-03-2.

摘  要:双语语料库的自动对齐已成为机器翻译研究中的一个重要研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,该文先分析了基于长度的方法,然后提出了基于译文的方法:通过使用一部翻译较完整的词典作为桥梁,把英汉句子之间的对应关系连接起来.根据英语文本中的单词,在词典中找到其对应的译文,并以译文到汉语句子中去匹配,根据评价函数和动态规划算法找到对齐句对.实验结果证明这种对齐方法消除了基于长度做法中错误蔓延的情况,它大大地提高了对齐的精度,其效果是令人满意的.Parallel corpora alignment is a important research issue in MT.The current sentence alignment methods include length-based and lexicon-based methods.This paper analyses length-based method and proposes translation-based method:With a dictionary as the bridge,corresponding translation of the words in English text are found in the dictionary and then matched with the translation of Chinese text.The alignment sentences are determined according to an evaluating function and the dynamic programming algorithm.The experimental result shows that this new method greatly improves the precision of sentence alignment.

关 键 词:机器翻译 句子对齐 双语语料库 英汉汉语句子 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象