检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]福州大学数学与计算机科学学院,福建福州350108
出 处:《山西大学学报(自然科学版)》2014年第1期19-25,共7页Journal of Shanxi University(Natural Science Edition)
基 金:福建省科技重大项目(2013H6012);教育部博士点基金联合资助项目(2012351410010);福建省自然科学基金(2010J05133);福州市科技计划(2012-G-113)
摘 要:提出了一种基于箱线图原理识别突发词的热点话题发现方法。该方法首先统计了噪声微博的特征,并根据这些特征对微博进行了过滤,然后利用箱线图原理识别突发词,最后通过计算不同时段突发词的权重来发现微博热点话题。实验结果表明,与SSM、EC、ELM方法相比,基于箱线图原理识别突发词的热点话题发现方法在F1值上平均提高了13.8%,而且对噪声不敏感。A new kind of method was proposed to detect the hot topic which used the principl recognize burst words. It counted the noise characteristics of Microblog,and filtered the Mi ing to these characteristics. Moreover,the principle of box-plot was used to recognize burst e of box-plot to croblog accord- words. Moreo- ver,it summated the weight of burst words to detect the microblog hot topics. The experiment result shows that compared with SSM,EC and ELM,the proposed scheme increases by an average of 13.8G in F1 val- ue,and it is insensitive to the noise.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28