基于相似度量矩阵HITS的改进算法  

New HITS Algorithm Based on the Similarity Metric

在线阅读下载全文

作  者:何明[1] 周军[1] 纪周鹏[1] 李树友[2] 

机构地区:[1]辽宁工业大学电子与信息工程学院,辽宁锦州121001 [2]辽宁工业大学数理科学系,辽宁锦州121001

出  处:《微电子学与计算机》2010年第7期194-197,共4页Microelectronics & Computer

基  金:国家自然科学基金项目(60674056);辽宁省教育厅科学研究基金(20060409)

摘  要:HITS算法是基于超链接结构的搜索引擎算法,但它对超链接不加以区分,容易产生"主题漂移"现象.改进后的HITS算法在原算法的基础上,提出了相似度量的迭代方法.该方法是将网页超链接结构信息、文本信息、联合引用信息结合成一个相似度量权重矩阵,通过权重矩阵来归一HITS算法每次产生的Authority、Hub值.在查询效率和质量方面,改进的HITS算法更优,也减少了"主题漂移"现象的发生.HITS based on the hyperlink structure is a search engine algorithm, but it links without any distinction, so this algorithm can lead to topic-drift. A new HITS algorithm puts forward a similarity metric iterative method is proposed after analyzed the old one. This iterative method incorporates link structure, textual information, and co-citation information into a similarity metric which gives rise to the weight matrix. This weight matrix normalizes the authority value and hub value that produced in every time of the HITS algorithm. The new HITS algorithm is more efficient and better than the old one in regard to the quality and efficiency about search. It also can avoid the problem of topic-drift.

关 键 词:HITS算法 主题漂移 相似度量 Authority值 Hub值 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象