英汉机译错误分类及数据统计分析  被引量:23

Error Patterns and Statistical Analyses of an English-Chinese Machine Translation Corpus

在线阅读下载全文

作  者:李梅[1] 朱锡明[1] 

机构地区:[1]同济大学外国语学院,上海200092

出  处:《上海理工大学学报(社会科学版)》2013年第3期201-207,共7页Journal of University of Shanghai for Science and Technology:Social Sciences Edition

基  金:教育部人文社会科学研究基金资助项目(07JA740010)

摘  要:作为一项历时5年探索机器翻译译后编辑自动化研究的重大阶段性成果,该项目采用汽车技术文献作为研究对象,通过对10万个英汉翻译句对做机器译文和人工标准译文的对比分析,发现机译典型错误并进行数据统计分析。介绍该研究所依据的机译错误分类标准,并以实例加以说明,得出的机译错误分析数据统计显示,机译错误率超过八成,其中词汇类错误占七成。本研究探索的机器翻译译后编辑新思路,对于降低机器翻译人工成本、提高机译效率和质量具有较高的实际价值和理论意义。This paper is based upon a five-year research project on a new attempt at post-editing of machine translation(MT).The research identified the MT error patterns of a text corpus of 100 000 sentence pairs of a car maintenance manual and did statistical analyses of the MT errors.Examples are used in this paper for illustrations of the error patterns.Our statistical analyses reveal that the MT errors reach as high as over 80%,and among the MT errors lexical errors stand at 70%.This research explored a cutting-edge attempt at MT post-editing and w as of great significance in improving the MT quality and efficiency as w ell as low ering the MT cost.

关 键 词:英汉机译译后编辑 错误分类 数据统计 汽车技术 语料库 

分 类 号:H085[语言文字—语言学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象