一种通用分布式数据抓取系统的设计与实现  被引量:5

Design and implementation of universal distributed data crawling system

在线阅读下载全文

作  者:潘庆和[1] 

机构地区:[1]哈尔滨商业大学计算机与信息工程学院,哈尔滨150028

出  处:《哈尔滨商业大学学报(自然科学版)》2016年第3期307-312,共6页Journal of Harbin University of Commerce:Natural Sciences Edition

摘  要:设计并实现了一种通用的具有高可靠性和可扩展性的分布式网络数据抓取系统.给出了服务器和抓取节点的执行算法,并利用实时数据库Influx DB和可视化框架Grafana设计了抓取节点的性能监控系统.利用系统可以跟据需求对互联网的数据进行快速地抓取和收集.In this paper, a universal distributed data crawling system with high reliability and scalability was designed and implemented. The algorithms that run on server and crawling nodes respectively were described. A performance monitoring system based on InfluxDB and Grafana was also created for real - time monitoring. This system can be used to rapidly crawl and collect the data from internet by requirements.

关 键 词:分布式网络系统 数据抓取 InfluxDB Grafana 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象