大规模特征集翻译系统判别式训练方法综述  被引量:1

The Summary of Discriminative Training Method of Large-scale Feature Set

在线阅读下载全文

作  者:刘宇鹏[1,2] 马春光[2] 刘水 刘乐茂[4] 赵石磊[1] 

机构地区:[1]哈尔滨理工大学软件学院,黑龙江哈尔滨150080 [2]哈尔滨工程大学计算机学院,黑龙江哈尔滨150001 [3]Baidu公司,北京150086 [4]哈尔滨工业大学计算机学院,黑龙江哈尔滨150080

出  处:《哈尔滨理工大学学报》2014年第4期100-105,共6页Journal of Harbin University of Science and Technology

基  金:国家自然科学基金(61300115);黑龙江省教育厅科学技术研究项目(12521073)

摘  要:由于传统机器翻译是在小规模的开发集上进行训练的,这样不能很好的拟合数据.为了更好的完成机器翻译任务,需要在大规模数据特征集合上进行训练,而且现在主流的机器翻译训练算法是判别式的训练方法,本文从这两个角度出发,在更大机器学习的框架下对于机器翻译任务进行建模,克服了原有机器翻译模型进行建模的时候数学抽象能力不够的问题,并从四个大的方面分析了大规模特征集机器翻译系统判别式训练算法所面临的问题进行了分析,并从文献上给出了相关问题的解决方法.The test procedure is not a good fit for data because machine translation (MT) uses small - scale development set during training stage. In order to improve MT performance, it requires training on the large - scale feature set, and we consider the advantages of discriminative MT training algorithm, so the summary is from these two aspects. To overcome the shortcomings of poor mathematical abstraction of existing MT model, we construct a MT model through the framework of machine learning. We analyse the general large - scale features training problems in MT system from four aspects and then give their solutions through paper survey.

关 键 词:损失函数 大规模特征集 在线算法 正则化 

分 类 号:TP391.2[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象