Heritrix在垂直搜索引擎中的应用  被引量:7

Application of Heritrix in Vertical Search Engine

在线阅读下载全文

作  者:白万民[1] 苏希乐[1] 

机构地区:[1]西安工业大学,陕西西安710032

出  处:《计算机时代》2011年第9期7-9,共3页Computer Era

摘  要:主要介绍了垂直搜索引擎和网络爬虫的基本概念,以及Heritrix系统的体系结构,分析了Heritrix工作流程,并通过扩展Heritrix实现了对网易手机频道信息的多线程抓取,为建立面向手机信息的垂直搜索引擎提供了信息源。We mainly introduce the basic concepts of vertical search engine and Web crawler, as well as the architecture of Heritrix, analyze the working process of Heritrix, and achieve multithreaded grabbing the information of NetEase mobile channel by expanding Heritrix, which provides the information source for creating vertical search engine oriented to mobile information.

关 键 词:垂直搜索引擎 网络爬虫 HERITRIX 多线程 

分 类 号:TP319[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象