检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]江西电信信息产业有限公司,江西南昌330025
出 处:《中文信息学报》2009年第2期77-82,共6页Journal of Chinese Information Processing
基 金:国家自然科学基金资助项目(60663007);江西省科技攻关项目(20062184);江西省教育厅科技项目(20072129)
摘 要:目前的跨语言信息检索能够使用的方法有四种:查询词翻译的方法、文档翻译的方法、中间语言翻译方法和非翻译的方法。该文对这四种方法进行了简要介绍,提出它们的优缺点,并且提出了一种新的非翻译的方法——基于中间语义的方法。我们对提出来的方法进行了TREC跨语言语料库的试验,并且与单语言的信息检索模型进行了比较。试验证明我们的方法具有很好的性能和健壮性。There are four main approaches to present cross-language information retrieval (CLIR) : query translation approach, document translation approach, interlingua representation approach and translation-flee approach. After discussing the advantages and disadvantages of these four approaches, this paper proposes a novel translation-free approach based on interlingua semantics. We test our approach on TREC cross-language corpus, and compare it with the mono-lingual information retrieval model. The results prove that our approach bears good performance and robustness.
关 键 词:计算机应用 中文信息处理 跨语言信息检索 中间语义 潜在语义对 偏最小二乘 TREC
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229