检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《汕头大学学报(自然科学版)》2013年第4期58-65,共8页Journal of Shantou University:Natural Science Edition
基 金:国家自然科学基金资助项目(61170130)
摘 要:K-prototypes算法是处理混合数据的主要聚类算法,大部分针对混合型数据的聚类算法都是选择数据集中的一部分数据作为聚类对象,而忽略了这类数据的特殊性与整体性,为了改进了数据的距离衡量,文中提出了一种新的聚类方法,该方法采用信息熵作为属性的权值,进行高精度和更加稳定的聚类,最后通过Matlab编程实现,采用uci数据集中credit等数据集进行仿真实验,证明改进算法是正确和有效的.K-Prototypes algorithm is the main clustering algorithm for processing mixed data. Since most clustering algorithms for mixed data choose parts of the data set as clustering objects, and ignore the particularity and globality of the data, a new data distance measure is improved in this paper. A new clustering method is proposed using the entropy as the attribute weights for more accurate and more stable clustering. Finally, uci data set in Matlab is used and the algorithm is proved correct and effective.
关 键 词:K-prototypes 特殊性 混合数据 信息熵 有效的
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3