检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]兰州理工大学计算机与通信学院,兰州730000
出 处:《计算机科学》2016年第2期86-88,共3页Computer Science
摘 要:针对WPR(Weighted PageRank)算法存在的在网页搜索方面的主题漂移和偏重旧网页的现象,综合网页的主题特征和最近搜索周期网页的被引用频率两个因素,提出了一种改进的算法WTFPR(Weighted Topic Frequency PageRank)。该算法通过内容分析,采用改进的TD-IDF算法来解决网页相关性,改善主题漂移现象;通过网页的最近搜索周期的被引用频率来提高那些较新而且价值较高的网页的PR值,从而改善偏重旧网页的现象。仿真结果表明,改进后的算法与WPR算法相比获得了更好的效果。For the topic drift and bias towards the old pages of WPR(Weighted PageRank)algorithm exist in the Web search,consolidated two factors of Web pages' topic features and referenced frequency in recent search cycle,we proposed an improved algorithm WTFPR(Weighted Topic Frequency PageRank).The algorithm uses improved TD-IDF algorithm to solve relevance of page by content analysis to reduce the topic drift.The algorithm improves the PR value of new and has high quality by referenced frequency of pages in recent search cycle,reducing bias towards the old pages.Simulation results show that the improved algorithm obtaines better results compared to WPR.
关 键 词:主题特征 被引用频率 偏重旧网页 搜索周期 主题漂移
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.43