基于均值的谱聚类特征向量选择算法  被引量:4

Eigenvector Selection Algorithm for Spectral Clustering Based on Mean

在线阅读下载全文

作  者:王森洪[1] 戴青云[2] 曹江中[1] 朱婧[1] 

机构地区:[1]广东工业大学信息工程学院,广东广州510006 [2]广东工业大学科技处,广东广州510006

出  处:《计算机与现代化》2013年第5期7-9,共3页Computer and Modernization

基  金:2008广东省省部产学研结合项目(2008B0900254);2008广东省现代信息业重点项目(GDIID2008IS005)

摘  要:在数据聚类当中,谱聚类是最流行的方法之一,其性能取决于所选取相关图的拉普拉斯(Laplacian)矩阵的特征向量。对于一个K类问题,Ng-Jordan-Weiss(NJW)谱聚类算法通常采用Laplacian矩阵的前K个最大特征值对应的特征向量作为数据的一种表示。然而,对于某些分类问题,这K个特征向量不一定能够很好地体现原始数据的信息。本文提出一种基于均值的谱聚类特征向量选择算法。该算法首先得出图的Laplacian矩阵的前3K个最大特征值的均值,然后选取K个离均值最近的特征值所对应的特征向量。相比传统谱聚类算法,该算法在UCI数据集上获得了较好的聚类性能。Spectral clustering is one of the most popular methods for data clustering, and its performance is determined by the quality of the eigenvectors of the related graph Laplacian matrix. For a K clustering problem, Ng-Jordan-Weiss (NJW) spectral clustering method adopts the eigenvectors corresponding to the K largest eigenvalues of the Laplacian matrix derived from a dataset as a novel representation of the original data. However, these K eigenvectors can not always reflect the information of the original data for some classification problems. This paper proposes an eigenvector selection method for spectral clustering. First this method calculates the mean of the 3 K largest eigenvalues from Laplacian matrix, and then select K eigenvectors whose eigenvalues are the nearest the mean eigenvalue. Experiments show that it can get better cluster results on UCI datasets and obtain more satisfying performance than classical spectral clustering algorithms.

关 键 词:谱聚类 LAPLACIAN矩阵 特征值 均值 特征向量选择 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象