多策略汉日机器翻译系统中的核心技术研究  被引量:4

Study on Key Technologies in a Multi-Strategy Chinese-Japanese Machine Translation System

在线阅读下载全文

作  者:杜伟[1] 陈群秀[1] 

机构地区:[1]清华大学计算机系清华信息科学与技术国家实验室(筹),智能技术与系统国家重点实验室,北京100084

出  处:《中文信息学报》2008年第5期60-66,共7页Journal of Chinese Information Processing

基  金:国家863计划重点资助项目(2006AA010109)

摘  要:多策略的机器翻译是当今机器翻译系统的一个发展方向。该文论述了一个多策略的汉日机器翻译系统中各翻译核心子系统所使用的核心技术和算法,其中包含了使用词法分析、句法分析和语义角色标注的汉语分析子系统、利用双重索引技术的基于翻译记忆技术的机器翻译子系统、以句法树片段为模板的基于实例模式的机器翻译子系统以及综合了配价模式和断段分析的机器翻译子系统。翻译记忆子系统的测试结果表明其具有高效的特性;实例模式子系统在1 559个句子的封闭测试中达到99%的准确率,在1 500个句子的开放测试中达到85%的准确率;配价模式子系统在3 059个句子的测试中达到了89%的准确率。Multi-strategy MT (Machine Translation) is a direction for machine translation system. This paper introduces the studies on certain key technologies in a multi-strategy Chinese-Japanese machine translation system. The system is made up by four sub systems ; the Chinese analysis system using lexcical analysis, syntax analysis and semantic role labeling, The translation memory MT using double index technology, the Example-based MT (EBMT) using syntax tree segments as translation templates and the valence-based MT using valence models and partition analyse. The test result shows that 1) the TM system is efficient, 2) the EBMT get 99% translation accuracy under the close-test of 1 559 Chinese sentences and 85 % accuracy under the open-test of 1 500 sentences and 3) the valency-based system get 89% accuracy under all 3 059 sentences.

关 键 词:人工智能 机器翻译 汉日机器翻译系统 汉语分析 翻译记忆技术 基于实例的机器翻译方法 基于配价的 机器翻译方法 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象