词语对齐的快速增量式训练方法研究  

Research on Fast Incremental Training Algorithm for Word Alignment

在线阅读下载全文

作  者:罗维[1] 

机构地区:[1]中国科学院计算技术研究所,北京100190

出  处:《北京大学学报(自然科学版)》2013年第1期88-94,共7页Acta Scientiarum Naturalium Universitatis Pekinensis

基  金:863计划(2011AA01A207)资助

摘  要:围绕翻译模型构建流程的瓶颈——词语对齐,着手翻译模型的增量式训练。在基于无监督学习的词语对齐模型的基础上,提出一种基于初始化同时应用迭代训练收敛速度更快的online EM算法,以替换通常所用的batch EM算法,实现增量式训练。实验表明,所提出的方法既高效又能保证词语对齐质量和机器翻译质量。This study puts emphasis on the incremental training algorithm for word alignment, which is the bottleneck during the construction of translation model. Based on two unsupervised word alignment models, the author proposes an incremental training algorithm which is based on initialization and online EM algorithm. Experiments show that the proposed method is efficient and would not hurt the quality of word alignment and translation.

关 键 词:统计机器翻译 词语对齐 增量式训练 期望最大化 在线算法 

分 类 号:TP391.2[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象