WEB爬虫

作品数:19被引量:99H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:叶允明马范援张岭于水崔志明更多>>
相关机构:苏州大学上海交通大学哈尔滨工业大学杭州安恒信息技术股份有限公司更多>>
相关期刊:《电子学报》《苏州大学学报(工科版)》《计算机工程》《计算机时代》更多>>
相关基金:国家自然科学基金上海市基础研究重大(重点)项目国家教育部博士点基金江苏省高技术研究计划项目更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机应用研究x
条 记 录,以下是1-2
视图:
排序:
一种基于状态转换图的Ajax爬行算法被引量:6
《计算机应用研究》2009年第11期4266-4269,共4页郭浩 陆余良 刘金红 
传统Web爬虫无法解决爬行Ajax应用所面临的JavaScript执行、状态识别与切换、重复状态检测等问题。为此,首先定义Ajax应用的状态转换图,并设计了一种基于状态转换图的Ajax爬行算法,通过该算法可以获取Ajax应用状态信息和后台DeepWeb资...
关键词:Ajax爬虫 状态转换图 WEB爬虫 DEEP WEB 
基于最优查询的多领域deep Web爬虫被引量:3
《计算机应用研究》2009年第9期3375-3377,共3页冯明远 林怀忠 
浙江省科技计划基金资助项目(2007C23086)
Deep Web信息通过在网页搜索接口提交查询词获得。通用搜索引擎使用超链接爬取网页,无法索引deep Web数据。为解决此问题,介绍一种基于最优查询的deep Web爬虫,通过从聚类网页中生成最优查询,自动提交查询,最后索引查询结果。实验表明...
关键词:DEEP WEB DEEP WEB爬虫 最优查询 页面聚类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部