基于锚文本相似度的PageRank改进算法  被引量:14

Improved PageRank Algorithm Based on Anchor Texts Similarity

在线阅读下载全文

作  者:王钟斐[1] 王彪[1] 

机构地区:[1]宝鸡文理学院数学系,陕西宝鸡721013

出  处:《计算机工程》2010年第24期258-260,共3页Computer Engineering

摘  要:分析搜索引擎Google的PageRank算法,给出其存在的3个问题及针对这3个问题提出的改进。结合锚文本相似度提出一种改进的PageRank算法,利用Nutch对传统PageRank算法和改进后的PageRank算法进行实验分析与比较。实验结果表明,改进的PageRank算法提高了搜索结果的查准率,有利于减少主题漂移现象。This paper analyzes PageRank algorithm, which is the key technology of search engine Google. Three issues and the existing iimprovements are pointed out. An improved PageRank algorithm combined with anchor texts similarity is proposed, and traditional PageRank algorithm and the improved algorithm are compared by Nutch. Experimental results show that the improved PageRank algorithm improves the precision of the search results, which help to reduce topic-drift phenomenon.

关 键 词:PAGERANK算法 锚文本 相似度 主题漂移 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象