搜索引擎倒排文件的一种分块组织技术  被引量:9

A Blocking Inverted File Structure for Search Engine

在线阅读下载全文

作  者:彭波[1] 李晓明[1] 

机构地区:[1]北京大学计算机科学技术系,北京100871

出  处:《电子学报》2005年第2期358-362,共5页Acta Electronica Sinica

基  金:国家 973计划项目 (No G1 9990 32 70 6) ;教育部博士点基金 (No 2 0 0 30 0 0 1 0 76)

摘  要:检索效率对大规模信息检索系统至关重要 .本文基于Web搜索应用背景 ,针对用户查询的统计特性 ,提出了一种分块组织倒排文件的方法 .通过建立检索性能模型 ,进行分析和仿真实验 ,结果表明这一方法下的检索算法可以有效的减少检索执行时间 ,并得到这一组织方式中分块参数的优化选择方法 .The efficiency of retrieval system is crucial for large scale information retrieval systems.By analyzing the documents and the users' query logs of a real search engine,a blocking inverted file structure is proposed.Simulation results show that the retrieval algorithm under the new organization of the inverted file can decrease its execution time significantly,and the optimal parameter selection for this blocking organization is discussed.

关 键 词:搜索引擎 信息检索 倒排文件 检索效率 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象