基于层次聚类的大样本加权支持向量机  被引量:5

Hierarchical clustering based on weighted SVM in large-scale data

在线阅读下载全文

作  者:冯一宁[1] 邵元海[1] 陈静[1] 王来生[1] 邓乃扬[1] 

机构地区:[1]中国农业大学理学院,北京100083

出  处:《计算机工程与设计》2009年第1期175-178,共4页Computer Engineering and Design

基  金:国家自然科学基金重点基金项目(10631070);国家自然科学基金项目(60573158;10771213;10871022)

摘  要:支持向量机的计算复杂度依赖于训练样本点数量,无法应用到大规模的数据集。本文采用约简样本点的思想,通过对原始的样本点进行层次聚类,将各聚类的质心赋予不同权重并训练可以达到减小训练规模的目的。针对大样本集的聚类算法,对不同的聚类中心赋予不同的加权惩罚系数,不仅使得在聚类过程中的复杂度大大降低,而且能在保证精度的前提下起到加快训练速度的作用。理论分析及实验结果表明,新算法能在高精度下使数据规模大幅缩减,缩短支持向量机的训练时间。Support vector machines (SVMs) are usually not used for large-scale data analysis because the training complexity is highly dependent on the data set size. A hierarchical clustering based on weighted SVM to train the centroids set of the clusters by the weighted penalty coefficient is presented using the idea of data reduction. Because of the cluster method and the weighted penalty coefficient, the algorithm speeds up the training process under the high classification precision. The theory analysis and the experiment results show that the new algorithm can reduce the training time with a high precision.

关 键 词:支持向量机 惩罚系数 层次聚类 聚类特征 BIRCH算法 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象