分布式Web信息采集系统的研究与设计被引量：10

Analysis and Design of Distributed Web Crawler

出　　处：《计算机工程与应用》2003年第16期162-166,182,共6页Computer Engineering and Applications

基　　金：中科院计算所领域前沿青年基金资助(编号:20016280-8)

摘　　要：Web信息的急速膨胀,使得Web信息采集面临一个巨大的挑战。针对这一情况,实现了一个分布式Web信息采集系统,以提高一般Web信息采集的能力。文章论述了分布式信息采集的基本原理、分类、难点以及相应的对策,并就该分布式Web信息采集系统进行了仔细的剖析。最后,对分布式Web信息采集的发展作了一个展望。Great enhancement on the web information brings to web crawler a big challenge.Facing this situation,this paper designs a distributed web crawler in order to improve capability of web crawler.This paper argues the principles,difficulties and measures of the distributed web crawler,and detailedly analyzes the SkyCollect distributed web crawler.Finally,it views the new direction of distributed web crawler.

关键词：信息采集分布式搜索引擎信息处理 WEB

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

分布式Web信息采集系统的研究与设计被引量：10

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

分布式Web信息采集系统的研究与设计 被引量：10

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

分布式Web信息采集系统的研究与设计被引量：10