一种抵抗链接作弊的PageRank改进算法  被引量:6

An Improved Pagerank Algorithm with Anti-Link Spam

在线阅读下载全文

作  者:贺志明[1] 王丽宏[2] 张刚[1] 程学旗[1] 

机构地区:[1]中国科学院计算技术研究所,北京100190 [2]国家计算机网络与信息安全管理中心,北京100029

出  处:《中文信息学报》2012年第5期101-106,共6页Journal of Chinese Information Processing

基  金:国家自然科学基金资助项目(61170230;60903139;60873243;60933005);国家863计划重点资助项目(2010AA012502;2010AA012503)

摘  要:大量的基于链接的搜索引擎作弊方法对传统PageRank算法造成了巨大的影响,例如,链接农场、交换链接、黄金链、财富链等使得网页的PageRank值失去了公正性和权威性。该文在分析多种作弊方法对传统PageRank算法所造成的不利影响的基础上,提出了一种可以抵抗链接作弊的三阶段PageRank算法-TSPageRank算法,该文对TSPageRank算法的原理进行了详细分析,并通过实验证明TSPageRank算法比传统的PageRank算法在效果上提高了59.4%,能够有效地提升重要网页的PageRank值,并降低作弊网页的PageRank值。A large number of link-based spares caused a huge impact on traditional PageRank algorithm, such as link farm, link exchange, golden links and so on. This paper proposes a new PageRank algorithm named Three Stages PageRank algorithm(TSPageRank) which can resist link spam to a certain extent. Through experiments, we found out that TSPageRank algorithm increased 59.4% on the result of PageRank. TSPageRank can increase the PR of useful and authority pages and decrease the PR of spam and rubbish pages.

关 键 词:搜索引擎作弊 PAGERANK算法 链接农场 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象