基于箱线图的微博客热点话题发现  被引量:6

Microblog Hot Topic Detection Based on Box-plot

在线阅读下载全文

作  者:郭德清[1] 廖祥文[1] 

机构地区:[1]福州大学数学与计算机科学学院,福建福州350108

出  处:《山西大学学报(自然科学版)》2014年第1期19-25,共7页Journal of Shanxi University(Natural Science Edition)

基  金:福建省科技重大项目(2013H6012);教育部博士点基金联合资助项目(2012351410010);福建省自然科学基金(2010J05133);福州市科技计划(2012-G-113)

摘  要:提出了一种基于箱线图原理识别突发词的热点话题发现方法。该方法首先统计了噪声微博的特征,并根据这些特征对微博进行了过滤,然后利用箱线图原理识别突发词,最后通过计算不同时段突发词的权重来发现微博热点话题。实验结果表明,与SSM、EC、ELM方法相比,基于箱线图原理识别突发词的热点话题发现方法在F1值上平均提高了13.8%,而且对噪声不敏感。A new kind of method was proposed to detect the hot topic which used the principl recognize burst words. It counted the noise characteristics of Microblog,and filtered the Mi ing to these characteristics. Moreover,the principle of box-plot was used to recognize burst e of box-plot to croblog accord- words. Moreo- ver,it summated the weight of burst words to detect the microblog hot topics. The experiment result shows that compared with SSM,EC and ELM,the proposed scheme increases by an average of 13.8G in F1 val- ue,and it is insensitive to the noise.

关 键 词:微博客 热点话题 突发词 箱线图 噪声微博 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象