一种基于数据包含度的自动聚类算法  被引量:1

An Automatic Clustering Algorithm Based on Data Contained Ratio

在线阅读下载全文

作  者:马云红[1] 王成汗 江腾蛟[1] 张堃[1] Ma Yunhong Wang Chenghan Jiang Tengjiao Zhang Kun(School of Electronics and Information, Northwestern Polytechnic University, Xi'an 710072, China)

机构地区:[1]西北工业大学电子信息学院,陕西西安710072

出  处:《西北工业大学学报》2016年第5期863-866,共4页Journal of Northwestern Polytechnical University

基  金:西北工业大学研究生创意创新种子基金(G2015KY0407);国家自然科学基金青年基金项目(61401363)资助

摘  要:聚类分析是机器学习和模式识别领域的一个重要问题,聚类算法常用于解决这类问题。针对传统聚类算法运算量大、不适应任意分布数据聚类的不足,提出了一种基于数据包含度的自动聚类算法。该算法引入数据包含度的概念,能够自动确定聚类个数和聚类中心,并进一步采用跟随策略实现聚类。多组数据的实验验证了自动聚类算法的有效性。对不同分布的数据进行了自动聚类算法与K-means聚类算法的聚类结果比较,实验结果表明自动聚类算法具有很好的聚类性能。Cluster analysis is an important issue for machine learning and pattern recognition. Clustering algorithm is usually used in solving these problems. A novel automatic clustering algorithm is developed based on data contained ratio. In automatic clustering algorithm which is presented in this paper,the concept of data contained ratio is proposed,the cluster number can be determined automatically based on the data contained ratio,and the relative cluster centers are found similarly Several groups data are used to testify and demonstrate the validity and effectiveness of the cluster algorithm. In addition,the comparison between the traditional K-means cluster algorithm and automatic cluster algorithm is processed. The results demonstrate that the automatic cluster algorithm has high performance in clustering random distribution data set.

关 键 词:聚类算法 数据包含度 数据局部密度 

分 类 号:TP311.5[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象