检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]兰州交通大学电子与信息工程学院,兰州730070
出 处:《计算机应用研究》2014年第1期43-46,共4页Application Research of Computers
基 金:国家自然科学基金资助项目(61163010);新世纪优秀人才支持计划资助项目(NCET-10-0017);甘肃省陇原青年创新人才扶持计划资助项目(252003);兰州市科技计划资助项目(2008-1-28);甘肃省电力信息通信中心资助项目(KJ[2012]80)
摘 要:以用户兴趣理论和用户之间的关注行为为基础,结合时间因素在微博热门话题检测中的重要作用,研究了如何有效获取微博中最新、最有价值的话题问题,基于PageRank经典算法提出了一种带时间参数的热门话题检测算法(TimePageRank)。算法首先使用投票机制抽取出用户感兴趣的话题并记录话题的生成时间;然后用权值计算公式计算每个话题的权值;最后使用TimePageRank算法对这些话题进行排名,从而检测出微博中的热门话题。真实数据集上的实验结果验证了该方法的高效性。Combined with the important role of the time factor in the detection of hot topics, this paper studied how to effectively get the latest and the most valuable topic issues in the micro-blog based on the theory of user interest and the behavior between users, and proposed a hot topic detection algorithm (TimePageRank, which modified the PageRank algorithm) with a time argument. First, the algorithm extracted topics which were interesting to users by using the voting mechanism and recorded the generation time of the topic. Then, it calculated the weight of each topic. Finally, this paper used the proposed algorithm to rank these topics to detect hot topics in the micro-blog. The experimental results over real data set illustrate the effectiveness and efficiency provided by the algorithm.
关 键 词:微博 热门话题 时间因素 TimePageRank算法 用户兴趣 PAGERANK算法
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.114