检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]重庆邮电大学网络智能研究所,重庆400065
出 处:《计算机应用研究》2016年第7期2026-2029,2038,共5页Application Research of Computers
基 金:重庆市教委科学技术研究项目(KJ130527);重庆市自然科学基金资助项目(CSTC;2014jcyj A40049);国家级大学生创新创业训练计划项目(201310617003)
摘 要:针对微博热点话题检测使用主题模型只能提取出无序话题词组合的问题,提出一种结合词激活力模型与主题模型各自优点的微博热点话题检测方法及话题关键词的计算方法。使用传统的主题模型提取出微博文本中的热点主题,根据各主题下文档的概率分布提取出新的话题文档,引入词激活力模型计算各个词之间的词激活力,生成词激活力矩阵,最后利用词激活力矩阵生成有序的词序列作为热点事件摘要。实验验证了该方法的可行性,表明所提出的方法能够很好地识别出热点词并生成可读性高的事件摘要。To solve the problem that microblog hot topic detection based on topic model can only extract disorderly words com- binations,this paper proposed a hot topic detection method on microblog combined with the advantage of word active force model and topic model, as well as its calculation method of keywords. Firstly, this approach extracted hot topic on microblog through topic model. Secondly, it extracted new documents according to the probability distribution of documents under each topic. Then, it generated the word active matrix by word active model. Finally, it generated an orderly sequence of words as hot topic by word active matrix. The experiments prove the feasibility of the proposed method which can effectively identify topic keywords and generate events with high readability.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117