统计机器翻译中一致性解码方法比较分析  

A Comparative Analysis of Consensus Decoding Methods for Statistical Machine Translation

在线阅读下载全文

作  者:段楠[1] 李沐[2] 周明[1,2] 

机构地区:[1]天津大学计算机科学与技术学院,天津300072 [2]微软亚洲研究院,北京100080

出  处:《中文信息学报》2013年第1期64-71,119,共9页Journal of Chinese Information Processing

摘  要:该文对近年来统计机器翻译研究中出现的多种一致性解码方法进行比较与分析。根据现有一致性解码方法对(单个或多个)统计机器翻译系统输出结果使用方式的不同,首先将其归纳为两大类:基于翻译假设重排序的一致性解码方法和基于翻译假设重组合的一致性解码方法;然后,针对每类方法,分别回顾其最具代表性的研究工作;最后,通过在大规模中—英机器翻译评测数据上的对比实验,对该文中介绍的多种方法进行比较,并对该课题未来研究方向进行展望。This paper presents a comparative analysis of various consensus decoding methods appeared in recent years for statistical machine translation (SMT). Based on different ways of using translation hypotheses generated by sin gle or multiple SMT systems, we classify current consensus decoding methods into two categories: hypothesis rerankingbased consensus decoding and hypothesis reconstructionbased consensus decoding. After reviewing the most representative work for each category, we perform ChinesetoEnglish machine translation experiments on large scale data sets to compare different methods listed in this paper. The future development prospects of consen sus decoding is discussed as well.

关 键 词:自然语言处理 统计机器翻译 一致性解码 最小贝叶斯风险解码 系统融合 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象