一种新的基于中间语义的跨语言信息检索模型  被引量:9

A Novel Cross Language Information Retrieval Model Based on Interlingua Semantics

在线阅读下载全文

作  者:黄国斌 王明文 叶浩 

机构地区:[1]江西电信信息产业有限公司,江西南昌330025

出  处:《中文信息学报》2009年第2期77-82,共6页Journal of Chinese Information Processing

基  金:国家自然科学基金资助项目(60663007);江西省科技攻关项目(20062184);江西省教育厅科技项目(20072129)

摘  要:目前的跨语言信息检索能够使用的方法有四种:查询词翻译的方法、文档翻译的方法、中间语言翻译方法和非翻译的方法。该文对这四种方法进行了简要介绍,提出它们的优缺点,并且提出了一种新的非翻译的方法——基于中间语义的方法。我们对提出来的方法进行了TREC跨语言语料库的试验,并且与单语言的信息检索模型进行了比较。试验证明我们的方法具有很好的性能和健壮性。There are four main approaches to present cross-language information retrieval (CLIR) : query translation approach, document translation approach, interlingua representation approach and translation-flee approach. After discussing the advantages and disadvantages of these four approaches, this paper proposes a novel translation-free approach based on interlingua semantics. We test our approach on TREC cross-language corpus, and compare it with the mono-lingual information retrieval model. The results prove that our approach bears good performance and robustness.

关 键 词:计算机应用 中文信息处理 跨语言信息检索 中间语义 潜在语义对 偏最小二乘 TREC 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象