一种支持动态页面的分布式爬虫系统设计与实现  

Design and implementation of a distributed crawler system supporting dynamic pages

在线阅读下载全文

作  者:林永意 卜言彬 Lin Yongyi;Bu Yanbin(Communication University of China Nanjing,Nanjing 211172,China)

机构地区:[1]南京传媒学院,江苏南京211172

出  处:《无线互联科技》2024年第6期84-86,共3页Wireless Internet Technology

基  金:江苏省高等教育学会专项课题支持项目,项目编号:2022JDKT128。

摘  要:针对互联网大数据时代背景下,信息的爆炸式增长使得人们难以快速准确地获取有效信息的难题,文章设计并实现了一种支持动态页面的分布式爬虫系统。该系统以Scarpy-Redis分布式爬虫框架为基础,结合了Selenium和PostgreSQL数据库等相关技术。该系统可以从大量的动态或者静态网页,分布式地获取所需要的信息,存入数据库以供用户使用。The article designs and implements a distributed crawler system that supports dynamic pages to address the challenges of the explosive growth of information in the context of the Internet big data era,which makes it difficult for people to quickly and accurately obtain effective information.The system is based on the Scarpy-Redis distributed crawler framework and combines related technologies such as Selenium and PostgreSQL databases.This system can obtain the required information from a large number of dynamic or static web pages in a distributed manner and store it in a database for users to use.

关 键 词:分布式 爬虫 动态页面 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象