检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:温娅娜 袁梓梁 何咏宸 黄猛[1] WEN Yana;YUAN Ziliang;HE Yongchen;HUANG Meng(Institute of Disaster Prevention,Sanhe065201,China)
机构地区:[1]防灾科技学院,河北三河065201
出 处:《现代信息科技》2020年第1期12-13,16,共3页Modern Information Technology
基 金:地震震害防御专项项目;中央高校基本科研业务费专项项目(ZY20180124)。
摘 要:网络的发展,大数据、人工智能的崛起使数据变得尤为重要,各行各业的发展都需要数据的支持,任何一种深度学习以及算法中都需要大量的数据作为模型来训练才能得出较为准确的结论。文中讨论了网络爬虫实现过程中的主要问题:了解网页基本结构、使用直观的网页分析工具对网页进行抓包分析、如何使用正则表达式获取准确的字符串信息、利用Python实现简单的页面数据获取。With the development of network,the rise of big data and artificial intelligence,data becomes more and more important.The development of all walks of life needs the support of data.Any kind of deep learning and algorithm needs a lot of data as a model for training to get a more accurate conclusion.This paper discusses the main problems in the implementation of web crawler:understanding the basic structure of web page,using the intuitive web page analysis tool to analyze the web page,how to use regular expression to obtain accurate string information,and using Python to achieve simple page data acquisition.
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.21