快速可扩展的子空间聚类算法  被引量:1

Fast Scalable Subspace Clustering Algorithm

在线阅读下载全文

作  者:刘博[1,2] 谢博鋆[1,3] 朱杰[1,4] 景丽萍[1] 于剑[1] 

机构地区:[1]北京交通大学计算机与信息技术学院交通数据分析与挖掘北京市重点实验室,北京100044 [2]河北农业大学信息科学与技术学院,保定071001 [3]河北大学数学与信息技术学院河北省机器学习与计算智能重点实验室,保定071002 [4]中央司法警官学院信息管理系,保定071000

出  处:《模式识别与人工智能》2016年第1期11-21,共11页Pattern Recognition and Artificial Intelligence

基  金:国家自然科学基金项目(No.61370129;61375062);教育部高等学校博士学科点专项科研基金项目(No.20120009110006);长江学者和创新团队发展计划(No.IRT201206);中央高校基本科研业务费基金项目(No.2014JBM029)资助~~

摘  要:子空间聚类算法只能处理小规模数据,且无法处理样本外数据.针对此问题,文中提出采用二次采样策略的子空间聚类框架(TSSC).该框架由两个核心部件组成:判别性协作表示(DCR)与多尺度K近邻(KNN)采样方法.在TSSC中,DCR首先结合多尺度KNN对数据点进行特征变换,从而保证属于同一子空间的点有更一致的表示.为了提高算法的可扩展性,TSSC在新的特征空间中使用多尺度KNN对数据进行二次采样,并根据采样点获得的初步聚类结果训练线性分类器,最后根据学习得到的分类器对剩余样本点进行分类,获得最终的聚类结果.在真实数据集上的实验验证TSSC的有效性.Most existing subspace clustering methods are inefficient for large scale datasets and are unable to handle out-of-sample data. To address these problems, a framework is proposed called two-stage sample selection for subspace clustering (TSSC). TSSC consists of two key components: discriminative collaborative representation (DCR) and multi-scale K nearest neighbors (KNN). DCR is combined with multi-scale KNN for feature mapping, and thus the samples belonging to the same subspace have more consistent representation. To enhance the scalability of the algorithm, multi-scale KNN is reused to select some information points from the new feature space by TSSC. Then, a linear classifier is trained according to the clustering result produced by the pre-selected points. Finally, the rest samples are categorized to obtain the final clustering result. Experiments conducted on the real-world datasets verify the effectiveness of TSSC.

关 键 词:子空间聚类 自表示 判别性协作表示 多尺度K近邻 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象