搜索引擎的混合索引技术  被引量:6

Mixture Inverted Index for Search Engine

在线阅读下载全文

作  者:彭波[1] 

机构地区:[1]北京大学计算机科学技术系网络与分布式系统实验室,北京100871

出  处:《计算机工程与应用》2004年第22期16-18,共3页Computer Engineering and Applications

基  金:国家973重点基础研究规划项目(编号:G1999032706);教育部博士点基金课题(编号:20030001076)资助

摘  要:倒排文件是搜索引擎检索系统普遍采用的索引技术。针对中文搜索引擎中采用自动分词的全文检索因分词词典规模小导致的检索效率下降与词典规模扩大导致检索效果下降的矛盾,论文在天网搜索引擎的实践基础上,提出了一种基于倒排文件实现的混合索引的方法,它可以有效提高搜索引擎下短语查询的检索效率,同时不影响系统检索效果。The full-text inverted index based on automatic Chinese segmentation is a popular technology for Chinese search engines.The size of the segmentation dictionary has large impacts on the efficiency and effectiveness of the re-trieval system.In this paper,we propose a mixture inverted index method.By the application in Tianwang search engine,it shows that this method can improve the retrieval efficiency for phrase queries and has no negative influence on sys-tem's effectiveness.

关 键 词:搜索引擎 信息检索 倒排索引 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象