WEB信息采集

作品数:31被引量:97H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:吴丽辉王斌张刚张凯余智华更多>>
相关机构:中国科学院华中科技大学重庆大学中国科学院研究生院更多>>
相关期刊:《计算机光盘软件与应用》《计算机技术与发展》《计算机工程与设计》《哈尔滨理工大学学报》更多>>
相关基金:国家重点基础研究发展计划国家社会科学基金国家自然科学基金全国统计科学研究计划重点项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
分布式JS解析在Web信息采集系统中的应用
《电子技术与软件工程》2020年第10期163-164,共2页梁元 
本文为了能够突破原本网页信息采集系统无法实现脚本解析的动态化信息采集技术弊端,提出在Web信息采集系统中运用分布式JS解析技术。首先概述JS解析脚本语言常用引擎技术,并实现JS解析结合Hadoop分布式计算,提取解析系统的实际运行所处...
关键词:分布式JS解析 WEB信息采集 Hadoop调度算法 
基于web的农产品市场价格分析与预测信息系统设计与实现被引量:1
《农家参谋》2018年第17期42-43,共2页杨雄钢 
基于web公开的农产品价格信息,使用网页爬虫技术对特定的产品和来源进行数据采集,分析和加工。采用移动平均、线性回归、时间序列等多种方法进行价格的预测分析、验证;并生成智能化、图形化的报告;通过微信公众号平台推送给订阅者,实现...
关键词:WEB信息采集 价格采集 价格预测 微信订阅 
基于大数据的小微企业统计信息采集策略被引量:4
《统计与决策》2017年第14期178-181,共4页张玉明 张远远 
国家社会科学基金重大项目(15ZDB157);国家社会科学基金重点项目(12AZD098);国家统计局全国统计科学研究重点项目(2013LZ23)
小微企业由于信息严重不对称导致融资难、融资贵、贷款难等问题,基于大数据来源之一的互联网社交媒体的小微企业信息采集是获取小微企业信息数据的重要途径。文章面对爆发式增长的互联网信息资源,利用主题聚焦网络爬虫技术、数据库技术...
关键词:大数据 小微企业信息 信息不对称 WEB信息采集 主题聚焦网络爬虫 
基于MongoDB的Web信息采集系统应用研究被引量:1
《湖南邮电职业技术学院学报》2017年第2期35-38,共4页孙美卫 
在降低成本、效率加大的情况下如何处理海量数据,是目前急需解决的重要问题。文章首先分析如何将Web日志存储到MongDB中,然后将其直接内置到MapReduce,将分析结果存储为文件以供业务人员查询分析,最后对日志分析系统进行性能测试。测试...
关键词:Mongo DB Web信息采集系统 日志分析 
基于XML的Web信息采集系统设计与实现被引量:3
《齐齐哈尔大学学报(自然科学版)》2017年第2期25-28,共4页王磊 
安徽省高校自然科学一般项目(113052015KJ09)
设计基于XML的Web信息采集系统,抽取出HTML页面中半结构化数据后,将清洗、解析后的数据置入My SQL数据库中。通过将类型相似页面的节点信息和字段描述配置于XML文件中,改进了网页对应独立抽取模板的方法,有效地提高了Web信息采集的效率...
关键词:WEB信息采集 抽取规则 XML 
面向主题的web信息采集系统的设计与实现
《信息与电脑(理论版)》2014年第11期16-17,共2页彭嫚 
贵州省科技计划项目([黔科合SY字[2013]3126号])
提出了一个基于Agent技术的数据采集系统,介绍了它的设计思想和工作流程,根据系统的需求分析,建立了一套基于人才招聘用户自定义的信息目录分类体系,详细阐述了整个系统关键部分的实现过程。通过对系统的测试表明,该数据采集系统具有良...
关键词:数据采集系统 信息采集系统 WEB信息 目录分类 人才招聘 网页信息 用户自定义 需求分析 分类目录 
web信息采集系统的需求分析
《计算机光盘软件与应用》2014年第11期47-47,49,共2页杜素芳 
本文对web信息采集系统进行需求分析,描述了系统具有的功能,并分析了系统的功能需求和非功能需求。
关键词:需求 信息 采集 
基于NekoHTML的Web信息采集研究
《现代计算机》2014年第5期77-80,共4页李娟 
当今万维网已成为一个庞大的资源库,其中包含海量的信息,同时也充斥大量垃圾信息。所以,如何有效地采集Web信息是当前研究的热点问题。通过研究Web信息采集技术和NekoHTML,介绍如何使用NekoHTML进行Web信息采集的方法。
关键词:WEB信息采集 
基于Web-Harvest的Web铁路信息采集系统的设计与应用被引量:2
《铁路计算机应用》2013年第3期41-44,共4页汤立 李雪山 
中国铁道科学研究院基金项目(2010YJ44)
基于Web-Harvest开源软件,并对其功能进行了扩展,设计并实现了具有较强通用性的Web铁路信息采集系统,阐释了系统构架和相关的技术,并通过实例介绍了该系统的应用。
关键词:Web—Harvest WEB信息采集 开源 
网络信息采集中链接与主题相关性的判定研究被引量:1
《计算机应用与软件》2012年第5期209-211,240,共4页王兰成 朱建华 
面向主题的Web信息采集需判断提取的URL链接主题相关性。基于主题链接上下文提取,主题型语义块采用提取链接周围一定长度的文本,目录型和图片型语义块利用DOM树层次结构,对链接数据进行URL相关性判定;利用知网基于语义相似度的链接判定...
关键词:WEB信息采集 语义分析 URL链接 主题相关性 
检索报告 对象比较 聚类工具 使用帮助 返回顶部