一种错误敏感的词对齐评价方法  被引量:3

An Error-Sensitive Evaluation Metric for Word Alignment

在线阅读下载全文

作  者:黄书剑[1] 奚宁[1] 赵迎功[1] 戴新宇[1] 陈家骏[1] 

机构地区:[1]南京大学计算机软件新技术国家重点实验室,江苏南京210093

出  处:《中文信息学报》2009年第3期88-94,共7页Journal of Chinese Information Processing

基  金:国家863高科技计划资助项目(2006AA010109);国家自然科学基金资助项目(60673043);国家社科基金资助项目(07BYY051);南京大学研究生科研创新基金资助项目(2008CL08)

摘  要:对齐错误率(Alignment Error Rate,AER)是目前通用的词对齐评价标准。近年来的研究表明,AER虽然在一定程度上能够反映词对齐的质量,但它与机器翻译最终结果BLEU得分的相关性并不好。该文针对基于短语的机器翻译系统(PBSMT)分析了AER可能存在的一些问题,并根据词对齐结果中存在的不同类型的错误,提出了一种错误敏感的词对齐评测方法ESAER(Error-Sensitive Alignment Error Rate)。实验表明,该文提出的ES-AER与BLEU的相关性要远远好于AER。AER (Alignment Error Rate) is a widely used alignment quality measure. Recent study shows that the AER score is not well correlated with the BLEU score of the final translation result. In this paper, we analyze the possible reasons for this weak correlation in a phrase-based SMT environment. We also propose a new alignment quality measure ESAER (Error-Sensitive Alignment Error Rate) according to different alignment errors. Experi- mental result shows that ESAER gets a much higher correlation with BLEU score than AER.

关 键 词:人工智能 机器翻译 统计机器翻译 词对齐 评价标准 AER 错误敏感 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象