检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:金萍[1,2] 宗瑜[1,2] 屈世超 胡燕[3] 田园[3]
机构地区:[1]皖西学院信息工程学院,六安237012 [2]中国科学与技术大学计算机科学与技术学院,合肥230027 [3]大连理工大学软件学院,大连116621
出 处:《南京大学学报(自然科学版)》2015年第1期197-205,共9页Journal of Nanjing University(Natural Science)
基 金:国家自然科学基金(61073110);安徽省自然科学基金面上项目(1208085MF95);安徽省教育厅自然科学基金重点项目(KJ2012A273,KJ2012A274);留学人员科研活动项目择优资助项目
摘 要:不确定数据聚类是传统数据挖掘的扩展,面对不确定数据聚类,研究者们经常把聚类问题描述成组合优化问题,并设计启发式聚类算法进行求解.现有的启发式聚类算法,如UK-means和UK-Medoids具有容易理解和实现简单等优点,但初始解敏感问题严重影响了聚类质量.本文在近似骨架理论的基础上,提出了一种近似骨架启发式聚类算法APPGCU(Approximate backbone guided heuristic clustering algorithm for uncertain data).该算法首先对原数据集完成P次采样,在采样后的规模较小的P个数据集上分别执行UK-Medoids算法得到P个局部最优解;然后通过对P个局部最优解求交得到近似骨架,并从中提取初始簇心;最后从初始簇心开始,启发式搜索出聚类结果.在仿真和实际数据集中的实验结果表明,算法APPGCU的聚类结果明显高于实验对比的启发式聚类算法,提高了聚类质量.As an extension of traditional data mining,uncertain data clustering gets wide interest of researchers.Uncertain data clustering is equivalent to a combinatorial optimization problem,and researchers usually solve it by using heuristic algorithms.As we knew,the existence heuristic clustering algorithms for uncertain data,such as UK-Means and UK-Medoids,are easy to be understood and to implemented,but these algorithms also have the initialization sensitivity problems which affect the clustering quality severely.In this paper,we propose an approximate backbone based heuristic clustering algorithm APPGCU(Approximate backbone guided heuristic clustering algorithm for uncertain data).In this algorithm,we first do Ptimes sampling on the original dataset,and run UK-Medoids on thePsampled datasets to get Psub-optimal solutions;then get the approximate backbone from the Psub-optimal solutions,and extract the initialization cluster center;eventually,re-run UK-Medoids with the initialization and get the solution by a heuristic search.The experiments on synthetic and standard UCI uncertain datasets demonstrate that APPGCU gets better clustering results than existing heuristic clustering algorithms,and improves the quality of clustering results.
关 键 词:NP-难解 启发式算法 近似骨架 不确定数据聚类
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229