网络信息采集

作品数:51被引量:110H指数:6
导出分析报告
相关领域:自动化与计算机技术文化科学更多>>
相关作者:张爽刘震张文德于建坤魏巍巍更多>>
相关机构:国家图书馆辽宁警官高等专科学校北京交通大学南京邮电大学更多>>
相关期刊:《计算机光盘软件与应用》《图书馆学刊》《内蒙古科技与经济》《图书情报工作动态》更多>>
相关基金:国家自然科学基金教育部人文社会科学研究基金威海市科技发展计划项目山东省优秀中青年科学家科研奖励基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
爬虫技术在科技图书馆网络信息采集中的应用——以核工业西南物理研究院图书馆为例被引量:1
《图书馆学刊》2024年第3期61-66,共6页段宏嘉 
以核工业西南物理研究院图书馆的学术新闻信息采集工作为例,介绍了PyCharm软件、requests库和lxml库的使用方法及爬虫技术的使用步骤,列举3个具有参考性的新闻信息采集应用案例,旨在方便科研人员全面且及时地掌握信息。
关键词:爬虫 科技图书馆 图书馆信息 信息服务 信息采集 
后保管模式下的重大社会事件档案资源建设研究被引量:1
《档案天地》2022年第11期49-53,共5页张笑玮 
重大社会事件是引发人们广泛关注,并对国家和社会的政治、经济、文化、军事、思想等方面形成深远影响的事件。因此伴随重大社会事件产生的档案资源,对还原当时环境、存留社会记忆具有重要的现实意义。2020年12月,国家档案局发布《重大...
关键词:档案资源建设 档案数据库 档案学界 国家档案局 档案知识库 档案管理部门 突发性事件 网络信息采集 
基于云计算的网络信息采集系统设计被引量:2
《信息与电脑》2021年第21期127-129,共3页王振坤 
针对现有网络信息采集系统存在数据抓取时间较长的问题,笔者基于云计算设计网络信息采集系统。对于硬件部分,搭建虚拟服务器集群,实现对网页端信息资源的有效管理;对于软件部分,基于云计算获取网页更新概率,采集分布式网络信息。实验结...
关键词:云计算 网络信息采集 虚拟服务器 
大数据应用下的网络信息采集系统优化设计
《电子世界》2021年第20期200-201,共2页徐亮亮 
如何在大数据环境中,提取和筛选优质精准的信息,是互联网用户普遍思考的问题。根据传统计算机信息采集技术,一般是通过系统的信息传感器进行信息数据的收集,然后进入计算机内部的逻辑软件进行相关信息的逻辑分析处理,再转化输出。这样...
关键词:系统服务器 信息采集技术 大数据应用 大数据环境 采集效率 互联网用户 互联网信息 收集率 
基于数据挖掘的网络信息采集与整编被引量:2
《电脑编程技巧与维护》2021年第8期81-82,141,共3页董汉霞 商乙山 吕东锋 
在计算机技术迅猛发展的今天,依托互联网产生的服务越来越多,产生的数据也越来越庞大。为了在繁杂庞大的数据中找到有用信息,提高信息的利用率,人们提出了数据挖掘的概念,旨在从海量数据中发现更加有价值的信息。对基于数据挖掘的网络...
关键词:数据挖掘 网络信息 信息采集 信息整编 
国家图书馆网络信息资源采集与保存平台关键技术实现被引量:9
《图书馆》2021年第3期45-50,共6页魏大威 季士妍 
文章介绍了国家图书馆网络信息资源采集与保存发展历程和技术发展,分析了基于开源架构进行定制开发的网络信息资源采集与保存平台的构建架构、功能特点,介绍了网络信息资源增量采集、增量回放显示功能实现的关键技术和方法,并对网络信...
关键词:网络信息采集 HERITRIX 增量采集 增量回放 国家图书馆 
档案学视角下的突发事件网络信息采集策略初探--以新冠肺炎疫情相关开源项目为例被引量:15
《档案学通讯》2020年第5期13-20,共8页吴建华 吕文婷 
南京大学完善重大疫情防控体制机制研究专项“重大疫情档案资源库建设研究”。
围绕突发事件形成的重要网络信息是突发事件档案的重要组成部分,也是构建完整、真实的社会记忆不可或缺的原材料。由于传统的档案收集方法和效率与网络信息产生的速度和数量不相匹配,亟须转变网络信息采集理念和方法。在论证突发事件重...
关键词:突发公共卫生事件 网络信息 开源项目 
大数据背景下的网络信息采集策略研究被引量:1
《内蒙古科技与经济》2020年第13期79-81,共3页齐虎春 
2018年度内蒙古化工职业学院自然科学科研项目“基于大数据的网络信息采集技术研究”(项目编号HYZR1805);内蒙古自治区教育科学研究“十三五”规划课题2019年度立项课题“高职院校技能大赛成果转化与促进专业课程建设的实践研究”(项目编号NZJGH2019197)。
介绍了网络爬虫技术的运行原理,分析了作为搜索引擎核心技术的通用网络爬虫的搜索策略,进而实现了采用两种搜索策略的网络爬虫,并在互联网中进行了信息爬取,最后比较总结了两种搜索策略的技术特点及优化研究方向。
关键词:网络爬虫 深度优先搜索 广度优先搜索 Python实现分析 
大数据视阈下网络信息采集系统优化设计被引量:1
《信息与电脑》2018年第22期90-91,94,共3页李玮瑶 
传统大数据网络信息采集系统内存重合严重,导致网络信息采集速率较低。因此,从大数据视阈下,对网络信息采集系统进行优化设计,提出一种改进后的网络信息采集系统。摒弃传统一体化结构,将信息采集控制区划分为中央处理器模块、传输链路...
关键词:大数据 采集 一体化 传输链路 
基于PyQt的全文搜索引擎平台开发被引量:2
《软件导刊》2018年第9期132-135,共4页张文超 胡玉兰 
国家自然科学基金项目(61373089;61672360)
网络信息数量的日益增加,对人们从中获取有效信息的能力提出了更高要求。为了更好地响应用户需求,提高信息处理效率并降低人力成本,基于PyQt进行全文搜索引擎平台开发。采用模块化思想设计网络信息采集功能,然后将获取的信息经数据处理...
关键词:全文搜索引擎 网络信息采集 PAGERANK PyQt 
检索报告 对象比较 聚类工具 使用帮助 返回顶部