检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《浙江理工大学学报(自然科学版)》2017年第2期237-241,共5页Journal of Zhejiang Sci-Tech University(Natural Sciences)
基 金:国家自然科学基金项目(61502430);浙江省自然科学基金项目(LY12F02041);浙江省公益技术研究工业项目(2016C31072);浙江省高校重中之重纺织科学与工程一级学科和浙江省服装工程技术研究中心优秀青年人才培养基金(2014KF15);研究生课程建设项目(11120132331501)
摘 要:用户通过检索平台虽然可以获得大量信息,但是搜索结果往往会出现主题漂移现象,不能满足用户的实际需求。为减少这种现象的发生,提出一种改进的PageRank算法。该算法基于传统的PageRank算法,先利用向量空间模型对页面间的相似度进行计算,然后依据相似度赋予不同的调控因子,并将它们引入到PageRank算法中,从而使得页面PR值的计算更加合理、科学。结果表明:改进后的PageRank算法在搜索应用中能够有效减少了主题漂移现象,搜索结果也更加符合用户需求。Users can get a lot of information through the search platform, , but the theme drift phenomenon often appears to search results. Thus, users’ actual needs cannot be met. In order to reduce the occurrence of this phenomenon, an improved PageRank algorithm is proposed. The algorithm based on traditional PageRank algorithm, first applies the vector space model (VSM) to calculate the similarity between pages, then gives different regulatory factors according to the similarity, introduces them to the PageRank algorithm, and finally makes P R value calculation more reasonable and scientific. The result shows that the improved PageRank algorithm can effectively reduce the theme drift phenomenon in the search application, and the search results are more in line with users’ needs.
关 键 词:PAGERANK算法 主题漂移 空间向量模型 相似度 互联网
分 类 号:TP399[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.216.94.79