检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:朱瑞超[1] 谭明川[1] 王泽宇[1] 向前[1]
机构地区:[1]云南大学信息学院
出 处:《电子制作》2017年第16期39-39,98,共2页Practical Electronics
摘 要:微博在信息共享与传播方面的独特优势,使得针对微博的研究越来越多。现阶段,针对校园舆情监测的信息较少,我们基于新浪微博设计开发了一款面向校园的微博舆情监测系统,实现了爬取信息、监测敏感词和分析用户影响力排名的功能。这里通过新浪微博api快速的爬取已经发布的微博,将爬取的数据使用IK正向迭代最细粒度切分算法进行分词与敏感词的提取,最后使用pagerank算法对用户的影响力进行排名。在大数据的背景下,该系统有着广阔应用范围和前景。
关 键 词:新浪微博 微博爬虫 IK正向迭代最细粒度切分算法 PAGERANK
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] TP393.092[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.119.1.164