平衡I/O和CPU的XML关键词检索

I/O and CPU Balanced XML Keyword Retrieval

机构地区：[1]中国人民大学数据工程与知识工程教育部重点实验室,北京100872 [2]中国人民大学信息学院,北京100872

出　　处：《计算机科学与探索》2010年第2期124-133,共10页Journal of Frontiers of Computer Science and Technology

基　　金：国家高技术研究发展计划(863)No.2009AA01Z149;中国人民大学和惠普中国实验室联合研究项目;北京市教委和中国人民大学产学研合作项目;中国人民大学研究生科学研究基金项目No.08XNG040~~

摘　　要：随着XML在数据交换和数据存储中的普遍应用,基于XML文档的信息检索研究逐渐成为新的研究热点。XML文档本身含有的结构信息可以使其检索精度得到很大提高,但相应地,XML检索中使用的较复杂的评分模型(如组合语言模型和推理网络的结构化评分模型)和较细的返回结果粒度(由文档转变为元素或者段落),也使得传统的信息检索由I/O密集型应用转变为CPU密集型应用。针对上述应用特点的转变,提出了一种新的检索处理框架,即保存数据的两种索引形式,根据系统的状态动态地调整任务调度,平衡I/O和CPU的处理,以达到减少单个查询的平均响应时间的目的。The widespread application of XML （extensive makeup language） makes it a new research focused on the area of information retrieval. Although the precision of XML information retrieval can be improved greatly because of the internal structure in XML documents, the finer retrieval granularity （i.e. elements or passages instead of documents） and more complex scoring and ranking models （e.g. the language model combined with the hierarchical inference network） convert traditional information retrieval applications which are I/O intensive into CPU-bound applications. In view of such a transformation, a new query processing framework of XML retrieval is proposed, which can dynamically balance I/O and CPU workloads to minimize average response time per query by creating two indexes for XML corpus and scheduling subtasks to use different indexes for queries evaluation according to the current state of the system.

关键词：可扩展标记语言结构化检索输入/输出语言模型

分类号：TP311.13[自动化与计算机技术—计算机软件与理论]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

平衡I/O和CPU的XML关键词检索

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

平衡I/O和CPU的XML关键词检索

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索