基于HTMLParser和HttpClient的网络爬虫原理与实现  被引量:8

The Principle and Implementation of the Web Crawler Based on HTMLParser and HttpClient

在线阅读下载全文

作  者:张亮[1] 

机构地区:[1]扬州工业职业技术学院电子信息工程系,江苏扬州225127

出  处:《电脑编程技巧与维护》2011年第20期94-94,103,共2页Computer Programming Skills & Maintenance

摘  要:介绍了网络爬虫的技术原理,给出了使用HTMLParser、HttpClient和Java实现简单网络爬虫的程序框架,对同类研究有一定的参考作用。In this paper,the principle of the web crawler is introduced,and simple framework of the Web crawler is implemented based on HTMLParser、HttpClinet and Java so fellow researchers could take reference.

关 键 词:网络爬虫 HTMLPARSER HttpClinet 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象