多维数据集中聚类数确定算法研究  被引量:2

Research on Determinition Algorithm of Clustering Number in Multi-dimensional Dataset

在线阅读下载全文

作  者:周红芳[1] 李红岩[1] 刘颖[2] 王晓东[3] 

机构地区:[1]西安理工大学计算机科学与工程学院,西安710048 [2]攀枝花学院计算机学院,四川攀枝花617000 [3]解放军防空兵指挥学院,郑州450052

出  处:《计算机工程》2012年第9期8-11,共4页Computer Engineering

基  金:国家"863"计划基金资助重点项目(2007AA010305);陕西省自然科学基础研究计划基金资助项目(SJ08-ZT14);陕西省教育厅科学研究计划基金资助项目(06JK229;09JK683)

摘  要:在传统确定数据集聚类数算法原理的基础上,提出一种新的算法——MHC算法。该算法采用自底向上的策略生成不同层次的数据集划分,计算每个层次的聚类划分质量,通过聚类质量选择最佳的聚类数。还设计一种新的有效性指标——BIP指标,用于衡量不同划分的聚类质量,该指标主要依托数据集的几何结构。实验结果表明,该算法能准确地确定多维数据集中的最佳聚类数。In order to better determine the optimal clustering number for multi-dimensional data, this paper proposes an new algorithm MHC, which is based on the principle of the traditional algorithm to determine the clustering number for the dataset. This algorithm adopts bottom-up method to generate dataset partition of different levels. In every division, the algorithm automatically generates the partition of clustering quality, and chooses the optimal clustering number by the clustering quality. Additionally, it still presents a new clustering validity index Between-In- Proportion(BIP), which is used to measure the different division of clustering quality, and mainly depends on the geometrical structure of datasets. Theoretical analysis and experimental results verify the effectiveness and good performance of the new validity index and the MHC algorithm.

关 键 词:多维数据集 聚类数 聚类有效性指标 层次聚类 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象