检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]华南理工大学经济与贸易学院,广东广州510006 [2]爱荷华大学计算机系
出 处:《情报理论与实践》2014年第2期112-116,共5页Information Studies:Theory & Application
基 金:教育部人文社会科学青年基金项目"基于虚拟社会网络挖掘的微博舆情监测方法及应用研究--以新浪微博为例"(项目编号:11YJC63004);中央高校基本科研业务费项目"微博舆情传播中的群体关系和情感倾向性研究"(项目编号:x2jmD2118170);广州市哲学社会科学规划项目"面向公共安全的网络舆情分析方法和监管机制研究"(项目编号:10B07)的成果
摘 要:热点主题识别旨在确定微博的热点主题,其分析结果对于人们获取即时重要资讯,了解社会关注焦点具有重要的应用价值。文章利用火车头采集工具对微博热点话题进行抓取,提出基于概率模型的微博热点主题识别模型,并比较与词频统计聚类方法在微博主题识别中效果的优劣。实验表明,该模型可以充分地利用概率模型的优点,相比于词频统计聚类算法,更适合应用于微博分析中的主题识别环节。Hot topic identification aims to determine the hot topics of micro-blogs, and its analysis results have an important application value for people to obtain the instant important information and understand the focuses of social concern. The paper grasps the hot topics of miero-blogs by using locomotive acquisition tools, proposes the hot topic identification model of micro-blogs based on probability model, and compares its effect of identifying micro-blog topics with that of the word frequency statistical cluste- ring method. The experiments show that the model can make full use of the advantages of the probability model, which is more suit- able for the topic identification link in the micro-blog analysis compared with the word frequency statistical clustering algorithm.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222