网页监控分布式爬虫  被引量:1

Distributed Web Monitoring Crawler

在线阅读下载全文

作  者:方宇浩 倪胜巧[1] 

机构地区:[1]四川大学计算机学院,成都610065

出  处:《现代计算机(中旬刊)》2015年第4期62-64,共3页Modern Computer

摘  要:互联网的飞速发展,改变人们获取信息的方式,互联网渐渐取代传统媒体,现在每天都有海量的信息在互联网上更新着,如今世界已经进入到以数据为中心的大数据时代。提出一种监控这些数据的分布式爬虫技术,以及一种基于网页结构的提取网页更新内容的算法。Internet is under rapid development and changing the way of obtaining information in life vividly, it is also on the way to replace tradi- tional media. Countless information are updated on the Internet every day, which means the whole world has in fact stepped into another era, the era of big data. Proposes a distributed system crawler to monitor the data and an algorithm to extract Web updated content based on Web structure.

关 键 词:爬虫 分布式系统 消息队列 

分 类 号:TP393.092[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象