检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘莹[1] LIU Ying(Jinan Polytechnic Engineering,Jinan 250200,China)
出 处:《无线互联科技》2024年第14期44-46,共3页Wireless Internet Technology
摘 要:网络爬虫是通过编写程序模拟浏览器访问服务器、获取目标数据的方法。在大数据环境下,爬虫速度成为影响网络爬虫性能的重要评价条件之一。Python语言因其丰富的第三方库,被广泛应用于网络爬虫及数据分析等场景。文章基于Python编程语言,以提高网络爬虫速度为目的,探讨实现网络爬虫速度提升的方案,并以某网站智能图片爬取为例实现多线程爬虫系统。A Web crawler is a method of obtaining target data by programming to simulate a browser accessing a server.In the big data environment,the speed of Web crawler is one of the important evaluation criteria affecting the performance of Web crawler.The Python language is widely used in scenarios such as Web crawler and data analysis due to its rich third-party libraries.Based on the Python programming language,the solution to improve the speed of Web crawling is explored in this paper with the target of improving the speed of Web crawling.And taking the intelligent image crawling on a certain Website as an example,a multi-threaded crawling system is implemented.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145