检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:林永意 卜言彬 Lin Yongyi;Bu Yanbin(Communication University of China Nanjing,Nanjing 211172,China)
机构地区:[1]南京传媒学院,江苏南京211172
出 处:《无线互联科技》2024年第6期84-86,共3页Wireless Internet Technology
基 金:江苏省高等教育学会专项课题支持项目,项目编号:2022JDKT128。
摘 要:针对互联网大数据时代背景下,信息的爆炸式增长使得人们难以快速准确地获取有效信息的难题,文章设计并实现了一种支持动态页面的分布式爬虫系统。该系统以Scarpy-Redis分布式爬虫框架为基础,结合了Selenium和PostgreSQL数据库等相关技术。该系统可以从大量的动态或者静态网页,分布式地获取所需要的信息,存入数据库以供用户使用。The article designs and implements a distributed crawler system that supports dynamic pages to address the challenges of the explosive growth of information in the context of the Internet big data era,which makes it difficult for people to quickly and accurately obtain effective information.The system is based on the Scarpy-Redis distributed crawler framework and combines related technologies such as Selenium and PostgreSQL databases.This system can obtain the required information from a large number of dynamic or static web pages in a distributed manner and store it in a database for users to use.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.117.73.187