检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:倪巍伟[1] 陈耿[2] 吴英杰[1] 孙志挥[1]
机构地区:[1]东南大学计算机科学与工程学院,江苏南京210096 [2]南京审计学院审计信息工程实验室,江苏南京210029
出 处:《软件学报》2008年第9期2339-2348,共10页Journal of Software
基 金:国家教育部高等学校博士学科点科研基金;江苏省自然科学基金~~
摘 要:分布式聚类挖掘技术是解决数据集分布环境下聚类挖掘问题的有效方法.针对数据水平分布情况,在已有分布式密度聚类算法DBDC(density based distributed clustering)的基础上,引入局部密度聚类和密度吸引子等概念,提出一种基于局部密度的分布式聚类算法——LDBDC(local density based distributed clustering).算法适用于含噪声数据和数据分布异常情况,对高雏数据有着良好的适应性.理论分析和实验结果表明,LDBDC算法在聚类质量和算法效率方面优于已有的DBDC算法和SDBDC(scalable dellsity-based distributed clustering)算法.算法是有效、可行的.Distributed clustering is an effect method for solving the problem of clustering data located at different sites. Considering the circumstance that data is horizontally distributed, algorithm LDBDC (local density based distributed clustering) is presented based on the existeding algorithm DBDC (density based distributed clustering), which can easily fit datasets of high dimension and abnormal distribution by adopting ideas such as local density-based clustering and density attractor. Theoretical analysis and experimental results show that algorithm LDBDC outperforms DBDC and SDBDC (scalable density-based distributed clustering) in both clustering quality and efficiency
关 键 词:分布式聚类 局部密度聚类局部聚类模型 密度吸引子 高维数据
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.55