统计机器翻译和翻译记忆的动态融合方法研究  被引量:6

Dynamic Combination of Statistical Machine Translation and Translation Memory

在线阅读下载全文

作  者:汪昆[1] 宗成庆[1] 苏克毅[2] 

机构地区:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100190 [2]台湾中央研究院资讯科学研究所

出  处:《中文信息学报》2015年第2期87-94,102,共9页Journal of Chinese Information Processing

基  金:国家自然科学基金(61402478)

摘  要:在融合翻译记忆和统计机器翻译的整合式模型的基础上,该文提出在解码过程中进一步地动态加入翻译记忆中新发现的短语对。它在机器翻译解码过程中,动态地加入翻译记忆片段作为候选,并利用翻译记忆的相关信息,指导基于短语的翻译模型进行解码。实验结果表明该方法显著提高了翻译质量:与翻译记忆系统相比,该方法提高了21.15个BLEU值,降低了21.47个TER值;与基于短语的翻译系统相比,该方法提高了5.16个BLEU值,降低了4.05个TER值。Under a framework of combining translation memory (TM) and statistical machine translation (SMT), this paper proposes to further dynamically add new phrase-pairs found in TM. During decoding, the integrated mod- el adds those TM matched segments into the SMT phrase table as candidates dynamically, and incorporates corresponding TM information for each hypothesis to guide SMT decoding. Our exPerimental results show that the proposed approach improves translation quality significantly: compared with TM system, the integrated model achieves 21.15 BLEU points improvements and 21.47 TER points reduction; compared with SMT system, the integrated model achieves 5.16 BLEU points improvements and 4.05 TER points reduction.

关 键 词:统计机器翻译 基于短语的翻译模型 翻译记忆 模型融合 动态加入翻译记忆短语对 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象