基于主题相似度改进的PageRank算法研究  被引量:1

Research on Improved PageRank Algorithm Based on Topic Similarity

在线阅读下载全文

作  者:刘齐 黄树成 LIU Qi;HUANG Shucheng(School of Computer Science and Engineering,Jiangsu University of Science and Technology,Zhenjiang 212000)

机构地区:[1]江苏科技大学计算机学院,镇江212000

出  处:《计算机与数字工程》2022年第1期45-48,60,共5页Computer & Digital Engineering

基  金:国家自然科学基金项目“基于鲁棒表现建模的目标跟踪方法研究”(编号:61772244)资助。

摘  要:用户通过检索平台能获得大量信息,但搜索结果往往会出现主题漂移、偏重旧网页的现象,不能满足用户实际需求。为改善这种现象,提出了一种改进的PageRank算法。该算法采用BM25相似度算法对主题相似度进行计算,根据相似度评分来赋予不同的影响权重,可以提相似度高的网页的排名;利用网页在搜索引擎周期内被搜索到的次数来表示网页存在的时间长短,补偿新网页的权重。将它们引入PageRank算法中,使得页面PR值计算更加合理。实验表明,改进后的PageRank算法在搜索应用中能有效减少主题漂移现象,搜索结果也更全面、更准确。Users can obtain a large amount of information through the retrieval platform,but the search results often appear to drift the subject and focus on old web pages,which cannot meet the actual needs of users.To improve this phenomenon,an im⁃proved PageRank algorithm is proposed.The algorithm uses the BM25 similarity algorithm to calculate the topic similarity,assign different impact weights based on the similarity score,and can increase the ranking of highly similar web pages,using the number of times a web page is searched in the search engine cycle to represent the Web length of time that exists,compensating for the weight of new pages.Introducing them into the PageRank algorithm makes the calculation of page PR values more reasonable.Exper⁃iments show that the improved PageRank algorithm can effectively reduce the topic drift in search applications,and the search re⁃sults are more comprehensive and accurate.

关 键 词:PAGERANK算法 主题漂移 BM25算法 时间反馈因子 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象