检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]厦门大学信息科学与技术学院模式识别与智能系统研究所,厦门361005 [2]浙江大学公共管理学院,杭州310027
出 处:《系统工程理论与实践》2008年第7期125-131,137,共8页Systems Engineering-Theory & Practice
基 金:厦门大学“985”工程二期项目“国防信息化安全智能创新平台”资助
摘 要:基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.文章提出了一种新的基于网格密度和空间划分树的CGDSPT(Clustering based on Grid-Density and Spatial Partition Tree)聚类算法.其创新点在于,将数据空间划分成多个体积相等的单元格,然后基于单元格定义了密度、簇等概念,对单元格建立了一种基于空间划分的空间索引结构(空间划分树)来对数据进行聚类.CGDSPT算法保持了基于密度的聚类算法的上述优点,而且CGDSPT算法具有线性的时间复杂性,因此CGDSPT算法适合对大规模数据的挖掘.理论分析和实验结果也证明了CGDSPT算法的优点.The density-based clustering algorithm is a sort of clustering analysis, its main merit is to discover arbitrary shape cluster and is insensitive to the noise data. This paper proposed a new clustering algorithm based on the grid density and the spatial partition tree CGDSPT. It is able to cluster data through dividing the data space into several unit cells. Some concepts, for example: the density, the bunch and so on, are defined on the unit cell. Then we established a spatial index structure for spatial division. The CGDSFT inherits the merit of the density-based clustering algorithm, moreover CGDSFT has the linear time-complexity, therefore it suits to the large-scale data mining. The theoretical analysis and the experimental result have also proven the merit of CGDSPT.
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28