检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张勇[1,2] 杨赛军 黄华 ZHANG Yong;YANG Saijun;HUANG Hua(Institute of Scientific and Technical Information of China,Beijing 100038;Wanfang Data Company limited,Beijing 100038)
机构地区:[1]中国科学技术信息研究所,北京100038 [2]北京万方数据股份有限公司,北京100038
出 处:《中国科技资源导刊》2021年第4期32-37,共6页China Science & Technology Resources Review
摘 要:传统PageRank算法用于文献排序时主要关注引证关系,新文献被阅读的概率非常低。本文引入CiteRank算法,结合出版时间、下载次数等指标,提出一种多维度混合排序的方法,应用于万方数据搜索引擎,对3亿篇文献进行多指标混合排序。实证分析结果表明,该排序方法提高了新文献和热门文献被访问的概率,排序结果更加契合用户搜索文献的需求。PageRank algorithm only pays attention to the citation relationship when it is used in literature ranking,and the probability of new literatures being read is very low.This paper conducts research from the perspective of multi-dimensional sorting,introduces the CiteRank algorithm,uses data such as publication year,download counts,etc.,to perform multi-index mixed sorting on 300 million literatures.The results show that the new sorting method improves the probability of new literatures and popular literatures being visited,and the search result is more in line with users’needs for finding literatures.
关 键 词:信息检索 文献排序 引证分析 PAGERANK CiteRank
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145