袁小洁

作品数:1被引量:2H指数:1
导出分析报告
供职机构:贵州大学计算机科学与信息学院更多>>
发文主题:HERITRIX信息采集网络爬虫爬虫更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《电脑编程技巧与维护》更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-1
视图:
排序:
基于Heritrix的商品信息搜索的网络爬虫系统的设计被引量:2
《电脑编程技巧与维护》2012年第22期74-74,81,共2页袁小洁 
探讨以开源软件Heritrix体系构建的获取商品信息爬虫系统,针对Heritrix开源爬虫项目存在的问题和商品采集的特点,项目设计了定向抓取包含某一特定内容的网页的类,从而改进Heritrix,并引入ELFHash算法进行URL散列中,以提高抓取效率,为面...
关键词:HERITRIX 网络爬虫 爬虫 商品信息采集 
检索报告 对象比较 聚类工具 使用帮助 返回顶部