高性能网页索引器JU_Indexer的实现  被引量:4

Implementation of a Web Page Indexer JU_Indexer with High Performance

在线阅读下载全文

作  者:赫枫龄[1] 左万利[2] 张雪松[1] 

机构地区:[1]吉林大学计算机科学与技术学院,长春130012 [2]吉林大学符号计算与知识工程教育部重点实验室,长春130012

出  处:《吉林大学学报(理学版)》2006年第1期50-56,共7页Journal of Jilin University:Science Edition

基  金:国家自然科学发展项目基金(批准号:60373099)

摘  要:高性能网页索引器JU_Indexer用倒排索引表存储网页索引数据,以多线程并行的方式对网页建立索引数据,采用经过优化的检索算法实现用户的查询.首先给出了JU_Indexer的系统框架,然后描述了索引数据在JU_Indexer中的存储结构、建立网页索引的算法、以及实现用户查询的检索算法.实验结果表明,JU_Indexer能在毫秒级的时间内完成用户的查询,它采用的经过优化的词组检索算法缩短了词组的检索时间.JU_Indexer, a web page indexer with high performance, uses the inverted index table to store index data for web pages, creates index data by multiple threads concurrently, utilizes the optimized search algorithms to implement the queries posed by users. First, the system architecture of JU_Indexer is given. Then, the data structure used to store the index data in JU Indexer, the algorithm employed to create web page index, and the strategy utilized to complete the queries proposed by users are described in great detail. The experiment result demonstrates that the queries proposed by users can be completed by JU_Indexer within milliseconds. The optimized phrase search algorithm employed by JU_Indexer shortens the time to complete the phrase querying.

关 键 词:WEB网页 网络搜索引擎 网页索引器 

分 类 号:TP393.09[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象