Web数据聚类算法研究  被引量:2

An Overview of Web Data Clustering Practices

在线阅读下载全文

作  者:常凯敏 张岩 王洪飞 于孟喜 

机构地区:[1]山西晋缘网络技术有限公司,太原030001

出  处:《电脑开发与应用》2015年第1期25-28,共4页Computer Development & Applications

摘  要:聚类是Web数据管理领域的一个具有挑战性的课题。各种形式的聚类要求在大范围内得到应用,包括找到镜像网页,探测侵权行为,并以结构化方式展示搜索的结果。概述了实现聚类在WEB用户和WEB资源得以应用的最流行的方法,并提出了当前的应用状态和WEB领域将来的发展前景。Clustering is a challenging topic in the area of Web data management. Various forms of clustering are required in a wide range of applications, including finding mirrored Web pages, detecting copyright violations, and reporting search results in a structured way. This paper presents an overview of the most popular methodologies and implementations in terms of clustering either Web users or Web sources and presents a survey about current status and future trends in clustering employed over the Web.

关 键 词:聚类 信息熵 邻近算法 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象