检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈国兰[1]
机构地区:[1]南京邮电大学图书馆,南京邮电大学科技情报研究所,南京210003
出 处:《情报杂志》2014年第9期123-128,共6页Journal of Intelligence
摘 要:鉴于近年突发事件在微博传播的巨大影响力,提出基于爆发词识别的微博突发事件监测方法。把微博突发事件监测分为微博预处理、爆发词抽取、爆发词聚类三个模块。先提出微博噪声数据过滤规则从海量数据中过滤噪声微博,然后采用相对词频、词频增长率、爆发词权重三个计算指标来提取出爆发词特征,最后采用共词分析方法来实现爆发词聚类,从而提取突发事件。最后以新浪微博数据为例进行实验,验证了提出的算法对突发事件监测能取得不错的效果。Giventhehuge influenceof emergencies in micro-blog spread in recent years,this paper presentsa study of the emergency detection on Chinese micro-blog based on burst words distinguishing. In this paper, the burst event detection on micro-blog is divided intothree modules,namely micro-blog pretreatment, burst word extraction and burst word clustering. Firstly, it puts forwardmicro-blog filtering rules to filter micro-blog noise data from massive data, and then usesthree indexes of therelative word frequency, the frequency rate of growth and the weight of words to extract the features for burstwords. Finally it usesthe co-word analysis and"absolute cluster" to achieve the burst word clustering. Experiments on Sina Micro-blog afterwards verifies the effectiveness of the algorithm proposed in this paper on emergency extraction.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117