检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:汪兰兰
机构地区:[1]长江大学电子信息学院
出 处:《电子世界》2020年第24期81-83,共3页Electronics World
摘 要:在如今信息科学技术迅速发展的时代背景下,大数据分析在我们的日常生活中发挥着越来越大的作用。而作为信息交互的平台—微博,为我们提供了多层次以及能够随意交流自己言论的功能。如何知道一篇文章下的评论数和评论内容,本论文研究了利用网络爬虫算法来收集微博评论,主要是模拟浏览器来抓取微博评论,该算法对于较多评论能够快速爬取,节省了许多时间,只需要4min左右就能够爬取全部评论。
关 键 词:大数据分析 信息科学技术 信息交互 浏览器 微博评论 网络爬虫算法 抓取算法 评论内容
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7