机器翻译系统融合技术综述  被引量:16

A Survey of System Combination for Machine Translation

在线阅读下载全文

作  者:李茂西[1] 宗成庆[1] 

机构地区:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100190

出  处:《中文信息学报》2010年第4期74-84,118,共12页Journal of Chinese Information Processing

基  金:国家自然科学基金资助项目(60975053;90820303;60736014);国家支撑计划资助项目(2006BAH03B02);国家863计划资助项目(206AA010108-4);中国新加坡数字媒体研究院资助项目(CSIDM-200804)

摘  要:该文对机器翻译研究中的系统融合方法进行了全面综述和分析。根据在多系统输出结果的基础上进行融合的层次差异,我们将系统融合方法分为三类:句子级系统融合、短语级系统融合和词汇级系统融合。然后,针对这三种融合方法,该文分别介绍了它们各自具有代表性的研究工作,包括实现方法、置信度估计和解码算法等,并着重阐述了近年来使用广泛的词汇级系统融合方法中用于构造混淆网络的词对齐技术。最后,该文对这三类系统融合方法进行了比较、总结和展望。This paper presents a survey of system combination for machine translation(MT).According to the different levels of combining the outputs from different machine translation systems,we classify the approaches to system combination into three types: sentence-level combination,phrase-level combination,and word-level combination.The representative work for each type is discussed in this paper,including the methods exploited,confidences estimated,and decoding algorithms,as well as the monolingual sentence alignment approaches which used to build the confusion network in the word-level system combination method.Finally,we discuss the three combination approaches and compare them with each other.The future development prospects of MT system combination are also discussed.

关 键 词:人工智能 机器翻译 系统融合 最小贝叶斯风险解码 混淆网络解码 词对齐 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象