检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中南财经政法大学信息与安全工程学院,武汉430074
出 处:《小型微型计算机系统》2016年第7期1450-1454,共5页Journal of Chinese Computer Systems
基 金:国家自然科学基金项目(71203164)资助;国家社会科学基金项目(14BXW033)资助
摘 要:网页的链接关系反映了网页之间联系的紧密程度,这种紧密关系是网页聚类的重要依据.首先通过对网页链路结构的特点分析,提出网页节点的基本集、扩展集、半径、邻域、密度和路径树等概念;然后,利用共享入度出度以及网页之间的相异度来衡量其距离,并结合扩展集中的链接信息设计了网页相似度的计算模型;最后,利用密度分布对网页进行聚类.实验结果表明,本算法具有较好的聚类效果.The relationships of links between Web pages reflect the close degree of the connection between web pages which is the basis of web page clustering. At first,this paper analyzes the characteristics of the structure of web page link,and puts forward the concept of basic web node set,extension set,radius,neighborhood,density and path relationship graph; Then,using the shared in-degrees,out-degrees and dissimilarity to measure distance between pages,combining to the similarity relationship of extension set,design the calculation formula of web distance based on link analysis; Finally,cluster web pages from the perspective of density distribution. The experimental results showthat the algorithm has good clustering effect.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.119.122.164