金明珠

作品数:2被引量:6H指数:2
导出分析报告
供职机构:上海理工大学光电信息与计算机工程学院更多>>
发文主题:URL过滤主题爬虫主题相关度字段统计模型更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机工程与设计》《计算机应用》更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-2
视图:
排序:
基于统计模型的主题爬虫的研究与实现被引量:3
《计算机工程与设计》2010年第16期3700-3704,共5页金明珠 丁岳伟 
在研究了现存的主题爬虫的基础上,提出了一种基于统计模型的主题爬虫,它对抓取过程中可获得的信息进行分析,并运用统计模型计算的结果过滤URL,有效地解决了偏好特定主题的用户检索和Web信息的索引等相关问题。实验结果表明,与基于链接...
关键词:统计模型 主题爬虫 URL过滤 特征信息 字段 
基于动态主题库的主题爬虫被引量:4
《计算机应用》2009年第B12期44-46,共3页金明珠 丁岳伟 
通过对基于不同策略过滤URL的主题爬虫的研究,提出了一种基于动态主题库的主题爬虫。它能够在运行期间实时地更新主题库,提高了对URL过滤的准确度。实验表明,所提的主题爬虫能够在相对较少的时间中,检索尽量少的网络空间,抓取到较多与...
关键词:主题爬虫 动态主题库 URL过滤 主题相关度 未知字段 
检索报告 对象比较 聚类工具 使用帮助 返回顶部