双语知识库中关联实例的多策略提取机制  被引量:1

The Association Example Multi-Strategy Extraction Mechanism Based on Bilingual Knowledge Corpus

在线阅读下载全文

作  者:张桂平[1] 姚天顺[1] 尹宝生[2] 蔡东风[2] 宋彦[2] 

机构地区:[1]东北大学软件与理论研究所,辽宁沈阳110004 [2]沈阳航空工业学院人机智能研究中心,辽宁沈阳110034

出  处:《中文信息学报》2007年第3期34-39,共6页Journal of Chinese Information Processing

基  金:国家863计划资助项目(2006AA012148);国家航空基金资助项目(05J54011);辽宁省自然科学基金资助项目(20042004)

摘  要:双语库是翻译记忆系统最重要的组成部分之一。从有限规模的双语库中提取更多的符合用户当前翻译需要的关联实例是翻译记忆技术研究的主要内容,本文首先对当前基于单一方法的实例检索算法存在的局限性进行了分析,并在对双语库进行知识化表示的基础上,提出了基于多策略的关联实例提取机制,即综合运用句子句法结构匹配、句子编辑距离计算、句子短语片段匹配、词汇语义泛化、基于扩展信息(如:句子来源、所属专业、应用频度等信息)的优选等策略进行关联实例提取。试验结果表明,该方法有效提高了关联实例的召回数量和质量,明显改善了对用户的辅助效果。Bilingual corpus is one of the most important parts in translation memory system. To extract more association examples which meet the present needs of users from limited scale of bilingual corpus is the main content of the research of translation memory technology. First of all, this paper analyzes the limits of the current example search method. Based on the knowledge representation of the bilingual corpus, this paper proposes multi-strategy based association example extraction mechanism, that is, to extract association example by using comprehensively the methods of tree matching, sentence edit-distance calculating, phrase chunk matching, lexicon semantic generalization, extended information based optimization (for instance, the information on sentence source, major belonged to, application frequency, etc. ). Experimental results indicate that the method effectively improved the recall quantity and quality of association example and the assistant effect to users.

关 键 词:人工智能 机器翻译 双语知识库 关联实例 多策略提取机制 翻译记忆 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象