检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西北师范大学计算机科学与工程学院,兰州730070
出 处:《计算机工程》2016年第3期208-213,共6页Computer Engineering
基 金:国家自然科学基金资助项目(61363058;61163039);中国科学院计算技术研究所智能信息处理重点实验室开放基金资助项目(IIP2014-4);甘肃省自然科学基金资助项目(145RJZA232);甘肃省青年科技基金资助项目(145RJYA259)
摘 要:结合词项关联关系和粒子群优化(PSO)算法的特点,提出一种基于离散PSO(DPSO)的微博热点话题发现算法。通过对词语互信息及内外关联词信息的挖掘,更新传统文本表示模型,利用DPSO算法从寻优角度发现微博热点话题及简化微博聚类过程,并将聚类质量评价指标作为适应度函数对聚类结果进行不断迭代优化,获得聚类结果的最优解。实验结果表明,该算法能够在大量微博中快速发现热点话题,具有较高的热点话题发现准确性及运行效率。Considering the term relationship and the characteristics of Particle Swarm Optimization( PSO),a hot topic detection method based on Discrete Particle Swarm Optimization( DPSO) is presented. The term mutual information and the intra / inter information are constructed to update the traditional text representation model. DPSO is adopted to detect hot topic which not only simplifies the clustering process but also takes clustering evaluation criteria as fitness function to get optimal solution of clustering results. Experimental results demonstrate that this algorithm can detect hot topics from huge number of microblogs accurately and quickly,and it has high accuracy and efficiency of hot topic discovering.
关 键 词:微博 热点话题发现 词项关系 文本表示模型 粒子群优化
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145