检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]山东师范大学信息科学与工程学院计算机科学与技术系,山东济南250014 [2]山东工商学院计算机科学与技术学院,山东烟台264005
出 处:《计算机工程与设计》2011年第12期4071-4074,共4页Computer Engineering and Design
基 金:国家自然科学基金项目(60970088)
摘 要:为了提高网页排序算法的效率,提高搜索引擎的检索质量,提出了融合反馈信息与内容相关度的PageRank改进算法。利用向量空间模型计算网页之间的主题相关性,得到网页的主题相关度权值。通过对网页被点击次数进行统计分析,得到网页点击量的增量权值。将这两个权值结合共同影响网页的PR(PageRank)值分配。通过仿真实验得到运用该算法后的实验结果,与其它算法的实验结果进行了比较,验证了该算法优于其它算法。To improve the efficiency of web sorting algorithm and improve the retrieval quality of the search engine,an improved Page-Rank algorithm merging feedback information and topical relationship is presented.Firstly,the theme relatedness weights are gotten by calculating the topical relationship between web pages using the vector space model.Then,through the statistical analysis of clicks,the clicks incremental weights are obtained.Finally,these two weights are merged to influence the distribution of the PR value.Comparing the experimental results of simulation,the advantage of this algorithm is proved.
关 键 词:网页级别 主题相关性 用户主观行为 点击量 爬取
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.12