利用组合模型生成微博热点话题事件摘要  被引量:8

Hot topic summarization on microblog generated by model combination

在线阅读下载全文

作  者:戴天[1] 吴渝[1] 雷大江[1] 

机构地区:[1]重庆邮电大学网络智能研究所,重庆400065

出  处:《计算机应用研究》2016年第7期2026-2029,2038,共5页Application Research of Computers

基  金:重庆市教委科学技术研究项目(KJ130527);重庆市自然科学基金资助项目(CSTC;2014jcyj A40049);国家级大学生创新创业训练计划项目(201310617003)

摘  要:针对微博热点话题检测使用主题模型只能提取出无序话题词组合的问题,提出一种结合词激活力模型与主题模型各自优点的微博热点话题检测方法及话题关键词的计算方法。使用传统的主题模型提取出微博文本中的热点主题,根据各主题下文档的概率分布提取出新的话题文档,引入词激活力模型计算各个词之间的词激活力,生成词激活力矩阵,最后利用词激活力矩阵生成有序的词序列作为热点事件摘要。实验验证了该方法的可行性,表明所提出的方法能够很好地识别出热点词并生成可读性高的事件摘要。To solve the problem that microblog hot topic detection based on topic model can only extract disorderly words com- binations,this paper proposed a hot topic detection method on microblog combined with the advantage of word active force model and topic model, as well as its calculation method of keywords. Firstly, this approach extracted hot topic on microblog through topic model. Secondly, it extracted new documents according to the probability distribution of documents under each topic. Then, it generated the word active matrix by word active model. Finally, it generated an orderly sequence of words as hot topic by word active matrix. The experiments prove the feasibility of the proposed method which can effectively identify topic keywords and generate events with high readability.

关 键 词:微博 话题检测 潜在狄利克雷分布 词激活力 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象