检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:肖志博[1] 王焕钢[1] 肖英超[1] 徐文立[1]
机构地区:[1]清华大学自动化系,北京100084
出 处:《东南大学学报(自然科学版)》2013年第A01期206-209,共4页Journal of Southeast University:Natural Science Edition
基 金:国家高技术研究计划(863计划)资助项目(2011AA060203);国家重点基础研究发展计划(973计划)资助项目(2009CB320602)
摘 要:提出了一种面向大规模数据集的单类支持向量机(OCSVM)方法.该方法基于k近邻思想得到表征数据集合分布特征的集合内点,并依此生成集合边缘点,而后由二者重新组成数据集合,用于OCSVM训练.该新建数据集不仅极大压缩了原有大规模数据集的样本数量,还可以保留原有大规模数据集的分布特征,从而有效解决了OCSVM在处理大规模数据集时所存在的训练时间长、模型复杂以及预测效率低等问题.最后,通过在典型数据集合上进行的对比实验,表明了所提方法的有效性.A method to train one-class support vector machine(OCSVM) on the large-scale data sets is proposed.The proposed method selects inner points representing the distribution characteristics of the original large-scale data sets based on the principle of k-nearest neighbor,and generates the edge points using the inner points selected.A new data set is formed by combining these tw o kinds of points to train OCSVM.The new data set not only reduces the volume of the original large-scale data set greatly,but also maintains the distribution characteristics of the original data set.Thus the problems faced by OCSVM on the large-scale data sets,such as long training time,complicated models and low predicting speed,are effectively solved.Finally,the experiment is conducted on typical data sets to illustrate the effectiveness of the method proposed.
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.80