检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘齐 黄树成 LIU Qi;HUANG Shucheng(School of Computer Science and Engineering,Jiangsu University of Science and Technology,Zhenjiang 212000)
出 处:《计算机与数字工程》2022年第1期45-48,60,共5页Computer & Digital Engineering
基 金:国家自然科学基金项目“基于鲁棒表现建模的目标跟踪方法研究”(编号:61772244)资助。
摘 要:用户通过检索平台能获得大量信息,但搜索结果往往会出现主题漂移、偏重旧网页的现象,不能满足用户实际需求。为改善这种现象,提出了一种改进的PageRank算法。该算法采用BM25相似度算法对主题相似度进行计算,根据相似度评分来赋予不同的影响权重,可以提相似度高的网页的排名;利用网页在搜索引擎周期内被搜索到的次数来表示网页存在的时间长短,补偿新网页的权重。将它们引入PageRank算法中,使得页面PR值计算更加合理。实验表明,改进后的PageRank算法在搜索应用中能有效减少主题漂移现象,搜索结果也更全面、更准确。Users can obtain a large amount of information through the retrieval platform,but the search results often appear to drift the subject and focus on old web pages,which cannot meet the actual needs of users.To improve this phenomenon,an im⁃proved PageRank algorithm is proposed.The algorithm uses the BM25 similarity algorithm to calculate the topic similarity,assign different impact weights based on the similarity score,and can increase the ranking of highly similar web pages,using the number of times a web page is searched in the search engine cycle to represent the Web length of time that exists,compensating for the weight of new pages.Introducing them into the PageRank algorithm makes the calculation of page PR values more reasonable.Exper⁃iments show that the improved PageRank algorithm can effectively reduce the topic drift in search applications,and the search re⁃sults are more comprehensive and accurate.
关 键 词:PAGERANK算法 主题漂移 BM25算法 时间反馈因子
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.147