基于页面相似度的PageRank算法  被引量:2

PageRank Algorithm Based on Page Similarity

在线阅读下载全文

作  者:王丰[1] 俞成海[1] 汪佳文 徐立波[1] 

机构地区:[1]浙江理工大学信息学院,杭州310018

出  处:《浙江理工大学学报(自然科学版)》2017年第2期237-241,共5页Journal of Zhejiang Sci-Tech University(Natural Sciences)

基  金:国家自然科学基金项目(61502430);浙江省自然科学基金项目(LY12F02041);浙江省公益技术研究工业项目(2016C31072);浙江省高校重中之重纺织科学与工程一级学科和浙江省服装工程技术研究中心优秀青年人才培养基金(2014KF15);研究生课程建设项目(11120132331501)

摘  要:用户通过检索平台虽然可以获得大量信息,但是搜索结果往往会出现主题漂移现象,不能满足用户的实际需求。为减少这种现象的发生,提出一种改进的PageRank算法。该算法基于传统的PageRank算法,先利用向量空间模型对页面间的相似度进行计算,然后依据相似度赋予不同的调控因子,并将它们引入到PageRank算法中,从而使得页面PR值的计算更加合理、科学。结果表明:改进后的PageRank算法在搜索应用中能够有效减少了主题漂移现象,搜索结果也更加符合用户需求。Users can get a lot of information through the search platform, , but the theme drift phenomenon often appears to search results. Thus, users’ actual needs cannot be met. In order to reduce the occurrence of this phenomenon, an improved PageRank algorithm is proposed. The algorithm based on traditional PageRank algorithm, first applies the vector space model (VSM) to calculate the similarity between pages, then gives different regulatory factors according to the similarity, introduces them to the PageRank algorithm, and finally makes P R value calculation more reasonable and scientific. The result shows that the improved PageRank algorithm can effectively reduce the theme drift phenomenon in the search application, and the search results are more in line with users’ needs.

关 键 词:PAGERANK算法 主题漂移 空间向量模型 相似度 互联网 

分 类 号:TP399[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象