检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]天津大学计算机科学与技术学院,天津300072 [2]微软亚洲研究院,北京100080
出 处:《中文信息学报》2013年第1期64-71,119,共9页Journal of Chinese Information Processing
摘 要:该文对近年来统计机器翻译研究中出现的多种一致性解码方法进行比较与分析。根据现有一致性解码方法对(单个或多个)统计机器翻译系统输出结果使用方式的不同,首先将其归纳为两大类:基于翻译假设重排序的一致性解码方法和基于翻译假设重组合的一致性解码方法;然后,针对每类方法,分别回顾其最具代表性的研究工作;最后,通过在大规模中—英机器翻译评测数据上的对比实验,对该文中介绍的多种方法进行比较,并对该课题未来研究方向进行展望。This paper presents a comparative analysis of various consensus decoding methods appeared in recent years for statistical machine translation (SMT). Based on different ways of using translation hypotheses generated by sin gle or multiple SMT systems, we classify current consensus decoding methods into two categories: hypothesis rerankingbased consensus decoding and hypothesis reconstructionbased consensus decoding. After reviewing the most representative work for each category, we perform ChinesetoEnglish machine translation experiments on large scale data sets to compare different methods listed in this paper. The future development prospects of consen sus decoding is discussed as well.
关 键 词:自然语言处理 统计机器翻译 一致性解码 最小贝叶斯风险解码 系统融合
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28