基于谱分析的无监督特征选择算法  被引量:5

Unsupervised feature selection approach based on spectral analysis

在线阅读下载全文

作  者:潘锋[1,2] 王建东[1] 牛奔[2] 

机构地区:[1]南京航空航天大学计算机科学与技术学院,南京210016 [2]深圳大学管理学院,广东深圳518060

出  处:《计算机应用》2011年第8期2108-2110,2114,共4页journal of Computer Applications

基  金:国家自然科学基金资助项目(71001072);广东省自然科学基金资助项目(9451806001002694)

摘  要:为提高无监督状态下特征选择的准确度,基于图谱理论证明了标准化Laplacian矩阵前K个最小特征值分布表现了簇结构的可识别性,使用谱分析方法指导无监督特征选择,提出了特征重要度排序算法。对大容量数据集特征选择,应用Nystrm方法降低时间复杂度。实验结果表明,使用该算法与使用主流无监督特征选择方法及全部特征相比能得到更高的聚类性能评分。To improve the performance of feature selection under the unsupervised scenario,the relationship between the distribution of the first K minimal eigenvalues for a normalized graph Laplacian matrix and the structure of the clusters was identified,and a new feature selection algorithm based on the spectral analysis was proposed.The feature selection algorithm might be time-consuming;hence the Nystrm method was applied to reduce the computational cost of the eigen-decomposition.The experiments on synthetic and real-world data sets show the efficiency of the proposed approach.

关 键 词:数据挖掘 聚类算法 无监督学习 谱分析 特征选择 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] TP301.6[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象