检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湖北工业大学计算机学院,湖北武汉430068
出 处:《计算机技术与发展》2011年第8期137-140,144,共5页Computer Technology and Development
基 金:湖北省教育科研项目(D20101407)
摘 要:针对Google PageRank算法中存在的"平均分配原则"及网络链接结构所造成的"旧网页问题"、"主题漂移问题",提出一种改进的网页排序算法N-PageRank。该算法通过对搜索日志进行数据挖掘,捕捉用户与搜索引擎之间的交互过程,发现隐藏在用户搜索行为背后的用户兴趣和搜索规律,利用用户行为反馈模型,分析网络日志里用户的各项行为特点,改善了排序结果的准确率,保证了搜索引擎的返回结果正是用户所希望看到的网页。实验证明该算法有效地降低了网页排序时的客观因素的影响,充分考虑了用户对于网页质量的评价,所得到的排序结果更加能够满足用户的需求。Analyzes the core algorithm of google-PageRank algorithm.Pointed out that the "principle of equal distribution",Web link structure caused by the "old Web page problem" and "topic drift".To solve these problems,based on the analysis on the original algorithm,proposes an improved N-PageRank algorithm,which through digging the search logs and found the user's interest and the law of search,feedback models using user behavior to analyze the user behavior characteristics in the search logs,to improve the accuracy of ranking results.Experimental results show: the algorithm reduces effectively the influence of objective factors during page sorting;give full consideration to the evaluation of the user for the website quality,the sort results obtained more able to meet the needs of users.
关 键 词:PAGERANK算法 搜索日志 用户兴趣 用户行为反馈模型
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.171