基于层次聚类的大样本加权支持向量机被引量：5

Hierarchical clustering based on weighted SVM in large-scale data

作　　者：冯一宁[1] 邵元海[1] 陈静[1] 王来生[1] 邓乃扬[1]

出　　处：《计算机工程与设计》2009年第1期175-178,共4页Computer Engineering and Design

基　　金：国家自然科学基金重点基金项目(10631070);国家自然科学基金项目(60573158;10771213;10871022)

摘　　要：支持向量机的计算复杂度依赖于训练样本点数量,无法应用到大规模的数据集。本文采用约简样本点的思想,通过对原始的样本点进行层次聚类,将各聚类的质心赋予不同权重并训练可以达到减小训练规模的目的。针对大样本集的聚类算法,对不同的聚类中心赋予不同的加权惩罚系数,不仅使得在聚类过程中的复杂度大大降低,而且能在保证精度的前提下起到加快训练速度的作用。理论分析及实验结果表明,新算法能在高精度下使数据规模大幅缩减,缩短支持向量机的训练时间。Support vector machines （SVMs） are usually not used for large-scale data analysis because the training complexity is highly dependent on the data set size. A hierarchical clustering based on weighted SVM to train the centroids set of the clusters by the weighted penalty coefficient is presented using the idea of data reduction. Because of the cluster method and the weighted penalty coefficient, the algorithm speeds up the training process under the high classification precision. The theory analysis and the experiment results show that the new algorithm can reduce the training time with a high precision.

关键词：支持向量机惩罚系数层次聚类聚类特征 BIRCH算法

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于层次聚类的大样本加权支持向量机被引量：5

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于层次聚类的大样本加权支持向量机 被引量：5

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于层次聚类的大样本加权支持向量机被引量：5