检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:黄书剑[1] 奚宁[1] 赵迎功[1] 戴新宇[1] 陈家骏[1]
机构地区:[1]南京大学计算机软件新技术国家重点实验室,江苏南京210093
出 处:《中文信息学报》2009年第3期88-94,共7页Journal of Chinese Information Processing
基 金:国家863高科技计划资助项目(2006AA010109);国家自然科学基金资助项目(60673043);国家社科基金资助项目(07BYY051);南京大学研究生科研创新基金资助项目(2008CL08)
摘 要:对齐错误率(Alignment Error Rate,AER)是目前通用的词对齐评价标准。近年来的研究表明,AER虽然在一定程度上能够反映词对齐的质量,但它与机器翻译最终结果BLEU得分的相关性并不好。该文针对基于短语的机器翻译系统(PBSMT)分析了AER可能存在的一些问题,并根据词对齐结果中存在的不同类型的错误,提出了一种错误敏感的词对齐评测方法ESAER(Error-Sensitive Alignment Error Rate)。实验表明,该文提出的ES-AER与BLEU的相关性要远远好于AER。AER (Alignment Error Rate) is a widely used alignment quality measure. Recent study shows that the AER score is not well correlated with the BLEU score of the final translation result. In this paper, we analyze the possible reasons for this weak correlation in a phrase-based SMT environment. We also propose a new alignment quality measure ESAER (Error-Sensitive Alignment Error Rate) according to different alignment errors. Experi- mental result shows that ESAER gets a much higher correlation with BLEU score than AER.
关 键 词:人工智能 机器翻译 统计机器翻译 词对齐 评价标准 AER 错误敏感
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:13.59.0.231