用核K-means聚类和半定规划SVM实现垃圾标签检测  

Detecting tag spam in social tagging systems with kernel K-means clustering and semi-definite programming SVM

在线阅读下载全文

作  者:覃华[1] 丁立朵[1] 符丽锦[1] 覃希[1] 

机构地区:[1]广西大学计算机与电子信息学院,南宁530004

出  处:《计算机应用研究》2013年第4期1179-1182,1186,共5页Application Research of Computers

基  金:国家自然科学基金资助项目(61063032);国家教育部人文社会科学研究项目(11YJAZH080)

摘  要:提出使用核K-means聚类算法从样本集中抽取特征向量集来训练SVM,达到减少SVM规模的目的。SVM核函数的选择会影响SVM模型的分类效果,提出将多个非线性映射能力不同的核函数进行线性组合,在特征训练集上构造出组合SVM的半定规划模型,用内点法求解出最优组合系数,得到非线性映射能力更强的半定规划SVM,并用做垃圾标签检测。在UCI数据集上与双层减样支持向量机方法进行比较,实验结果表明,新的垃圾标签检测法提高了识别率,并大幅度减少了训练时间。This paper presented a method.It used kernel K-means clustering algorithm to extract the character vector set from the samples and got the optimal combinatorial coefficients of different functions to construct semi-definite programming SVM with stronger nonlinear mapping ability.Experimental results on UCI datasets show that compared with double-layer reduction method,the new method gives higher accuracy and speeds up obviously.

关 键 词:垃圾标签识别 支持向量机 多核函数组合 半定规划 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象