基于PageRank的微博排名MapReduce算法研究  被引量:11

Research on MapReduce Algorithm of Micro Blog Ranking Based on PageRank

在线阅读下载全文

作  者:舒琰[1] 向阳[1] 张骐[2] 张熊熊[3] 张君瑛 

机构地区:[1]同济大学电子与信息工程学院,上海201804 [2]神华和利时信息技术有限公司,北京100011 [3]上海证券交易所,上海200120 [4]上海市陈家镇建设发展有限公司,上海202162

出  处:《计算机技术与发展》2013年第2期73-76,81,共5页Computer Technology and Development

基  金:国家自然科学基金资助项目(70771077);国家"863"高技术发展计划项目(2008AA04Z106);上海市科技创新计划(11DZ1501703;(陈家镇)11DZ1210600);上海市信息化发展专项资金项目(200901 015);上海市科委项目(08DZ1122300)

摘  要:随着社交网络的发展,对于其数据的挖掘与分析已经成为一个热门领域。在微博中,用户排名通常是单纯根据粉丝人数进行排列,而这种方法并不公正。针对这一问题,结合网页PageRank算法,提出了新的排名算法,以用户为节点,用户关系为有向边,建立概率转移矩阵,计算微博用户PageRank值。该算法能有效减少垃圾用户对微博排名的影响,来提高排名的公平性与准确性。实验测试在云环境下进行,结果显示了新的排名结果,与现有的微博粉丝排名相比,更加公平,具有一定的实用价值。With the development of social network service, mining and analyzing data from SNS is becoming an active area of science. In micro blog,the user ranking is based on the number of fans,but it is not very fair. In this paper,propose a new ranking algorithm based on web PageRank,in which use the data from Sina Weibo to yield a graph with nodes and edges. Then build a transition probability ma- trix to compute every user' s PageRank. This algorithm can make the user ranking more fair and more closely to reflect the reality. The experiments are conducted in cloud, which present a new ranking result and the algorithm has some practical value, comparing with the follower ranking.

关 键 词:微博 PAGERANK MAPREDUCE 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象