检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:赵兴旺[1,2] 梁吉业[1,2] 曹付元[1,2]
机构地区:[1]山西大学计算机与信息技术学院,山西太原030006 [2]计算智能与中文信息处理教育部重点实验室,山西太原030006
出 处:《广西师范大学学报(自然科学版)》2009年第3期130-133,共4页Journal of Guangxi Normal University:Natural Science Edition
基 金:863计划资助项目(2007AA01Z165);国家自然科学基金资助项目(60773133);山西省自然科学基金资助项目(2008011038);山西省重点实验室开放基金(200603023);山西省高校科技开发项目(2007103)
摘 要:在聚类分析中,如何选择恰当的聚类个数是一个非常复杂而又必须面对的问题。尽管针对数值型数据聚类个数的选择算法已经进行了广泛地研究,但如何确定符号型数据的聚类个数仍然是一个富有挑战性的问题。结合划分和层次聚类的思想,提出一种符号数据聚类个数的确定算法。在UC I数据集上的实验结果表明该方法是有效的。In clustering analysis,how to select a proper number of clusters is a complex problem. Though much efforts have been made to select the best number of clusters for numerical data,it is still a chal- lenging issue for categorical data. In this paper,based on the ideas of partitional and hierarchical clustering, an algorithm is proposed to determine the best number of clusters for categorical data ,and the corresponding time complexity is analyzed as well. Experimental results on real world datasets of UCI demonstrate that the proposed algorithm is effective.
关 键 词:K-Modes聚类算法 聚类个数 初始类中心 划分聚类 层次聚类
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117