检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孟宪颖[1] 毛应爽[1] MENG Xianying;MAO Yingshuang(Changchun Institute of Technology,Changchun Jilin 130022)
机构地区:[1]长春工程学院,吉林长春130022
出 处:《软件》2021年第11期128-130,共3页Software
摘 要:大数据背景下,怎样快速有效地获取所需的数据信息成为互联网企业和网络用户热切关注的内容。网络爬虫在网络数据采集与分析上发挥了重要的作用。本文以京东作为目标网站,采用Python的爬虫技术,设计了一种商品采集与分析的方法。使用Requests库对按关键字搜索的结果商品信息进行下载,使用正则表达式和Beautiful Soup对数据进行初步清洗,最后将数据存储到MongoDB数据库中,实现了预想的目标。Under the background of big data,how to quickly and effectively obtain the required data information has become the hot concern of internet enterprises and network users.Web crawler plays an important role in network data collection and analysis.This article takes "Jingdong" as the target website and designs a method of commodity collection and analysis by Python crawler technology.The Requests library is used to download the product information of the search results by keyword,the regular expression and Beautiful Soup are used to preliminarily clean the data,and finally the data is stored in the MongoDB database to achieve the expected goal.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222