基于多重线性回归模型的翻译等价对获取  

Acquisition of Translation Equivalences Based on Multiple Linear Regression

在线阅读下载全文

作  者:张春祥[1] 赵铁军[1] 李生[1] 

机构地区:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001

出  处:《计算机工程与应用》2006年第4期1-3,26,共4页Computer Engineering and Applications

基  金:国家863高技术研究发展计划资助项目(编号:2002AA117010-09);国家自然科学基金资助项目(编号:60375019)

摘  要:翻译等价对在词典编纂、机器翻译和跨语言信息检索中有着广泛的应用。文章从双语句对的译文等价树中抽取翻译等价对。使用译文直译率、短语对齐概率和目标语-源语言短语长度差异等特征对自动获取的等价对进行评价。提出了一种基于多重线性回归模型的等价对评价方法,并结合N-Best策略对候选翻译等价对进行过滤。实验结果表明:在开放测试中,基于多重线性回归模型的等价对评价及过滤方法其性能要优于其它方法。Translation equivalence is very useful for bilingual lexicography,machine translation system and cross-lingual information retrieval.In this paper,translation equivalences are extracted from translation corresponding trees of bilingual sentence pairs.Translation literality,phrase alignment probability,and length difference from target language phrase to source language phrase are employed to score for ex.tracted equivalences.An evaluation method based on multiple linear regression is proposed.This new approach is employed to filter equivalences combined with N-Best strategy.Experimental results show that the new method does better than other approaches on evaluation and filtering.

关 键 词:翻译等价对 多重线性回归模型 N—Best策略 

分 类 号:TP391.2[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象