检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:禹贵辉[1] 潘志斌[1] 乔瑞萍[1] 邹彬[1]
机构地区:[1]西安交通大学电子与信息工程学院,西安710049
出 处:《微电子学与计算机》2011年第11期152-156,共5页Microelectronics & Computer
基 金:国家自然科学基金项目(60672054);陕西省科学技术攻关项目(2008K04-01);高校博士点基金项目(20100201110030)
摘 要:文中提出了一种新的基于数据局部和全局分布特性的K-Means初始化方法.算法通过对数据空间进行网格化后统计每个网格中数据点数目,选取具有数目局部最大值的网格,再利用距离优化方法全局的估算出K个初始聚类中心.在人工和真实数据集上,进行了与传统的聚类中心初始化算法的比较.实验结果表明,该算法利用局部最大值网格和距离优化的方法估算的聚类中心能够在保持及改善聚类效果的同时,明显减少迭代次数,提高收敛速度.A new initializing algorithm based on data distribution is proposed for K--Means in this paper. First we partition data space into grid and find the local--maximum cell which counts more data points than its neighborhood cells. Then we use distance optimization method to choose the seed clusters from local--maximum cells globally. Benchmark experiments evaluate the proposed method and five other typical initialization methods on both synthetic and real--life data sets, and the results demonstrated that our proposed algorithm gives faster convergence speed without descending in clustering performance.
关 键 词:初始聚类中心 K-均值算法 网格化 局部最大值 距离优化
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.175