检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]辽宁工业大学电子与信息工程学院,辽宁锦州121001 [2]辽宁工业大学数理科学系,辽宁锦州121001
出 处:《微电子学与计算机》2010年第7期194-197,共4页Microelectronics & Computer
基 金:国家自然科学基金项目(60674056);辽宁省教育厅科学研究基金(20060409)
摘 要:HITS算法是基于超链接结构的搜索引擎算法,但它对超链接不加以区分,容易产生"主题漂移"现象.改进后的HITS算法在原算法的基础上,提出了相似度量的迭代方法.该方法是将网页超链接结构信息、文本信息、联合引用信息结合成一个相似度量权重矩阵,通过权重矩阵来归一HITS算法每次产生的Authority、Hub值.在查询效率和质量方面,改进的HITS算法更优,也减少了"主题漂移"现象的发生.HITS based on the hyperlink structure is a search engine algorithm, but it links without any distinction, so this algorithm can lead to topic-drift. A new HITS algorithm puts forward a similarity metric iterative method is proposed after analyzed the old one. This iterative method incorporates link structure, textual information, and co-citation information into a similarity metric which gives rise to the weight matrix. This weight matrix normalizes the authority value and hub value that produced in every time of the HITS algorithm. The new HITS algorithm is more efficient and better than the old one in regard to the quality and efficiency about search. It also can avoid the problem of topic-drift.
关 键 词:HITS算法 主题漂移 相似度量 Authority值 Hub值
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117