检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001 [2]微软亚洲研究院,北京100080
出 处:《智能计算机与应用》2014年第6期31-34,共4页Intelligent Computer and Applications
摘 要:统计机器翻译的准确性在很大程度上取决于翻译建模的质量,而翻译建模往往依赖于数据的分布。通常,大多数机器学习任务会假设训练数据和测试数据是独立同分布的,然而在实际的系统中,这种假设未必成立。因此,为了达到性能的最优,需要根据数据分布的情况对模型进行适当的迁移。近年来,领域自适应技术成为统计机器翻译研究中的一个热点话题,目的在于解决训练数据和测试数据的领域分布不一致问题。本文介绍了几类流行的统计机器翻译领域自适应方法,并对未来的研究提出一些展望。Statistical Machine Translation (SMT) depends largely on the performance of translation modeling, which fur- ther relies on data distribution. Usually, many machine learning tasks assume that the data distributions of training and tes- ting domains are similar. However, this assumption does not hold for real world SMT systems. Therefore, the researchers need to adapt the models according to the data distribution in order to optimize the performance. Recently, domain adapta- tion is an active topic in SMT and aims to alleviate the domain mismatch between training and testing data. This paper in- troduces several popular methods in domain adaptation for statistical machine translation and discusses some future work in this area.
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249