检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:潘吴斌[1,2] 程光[1,2] 郭晓军[1,3,2] 王艳[1,2]
机构地区:[1]东南大学计算机科学与工程学院,南京210096 [2]计算机网络和信息集成教育部重点实验室(东南大学),南京210096 [3]西藏民族学院信息工程学院,陕西咸阳712082
出 处:《计算机学报》2014年第10期2128-2138,共11页Chinese Journal of Computers
基 金:江苏省未来网络前瞻性研究项目(BY2013095-5-03);江苏省科技支撑计划(工业)项目(BE2011173);江苏省"六大人才高峰"高层次人才项目(2011-DZ024)资助
摘 要:机器学习在网络流量分类中存在特征选择度量指标单一、类别不平衡和概念漂移等问题,使得模型复杂度提高、泛化能力下降.该文提出基于选择性集成策略的嵌入式特征选择方法,根据选择性集成策略选取部分特征选择器集成,再改进序列前向搜索和封装器组合方法二次搜索最优特征子集.实验结果表明该算法在保证分类效果的同时有效降低了特征子集复杂度,从而达到了分类效果、效率和稳定性的最优平衡.The problems of feature selection metrics single,class imbalance and concept drift exist in machine learning for network traffic classification,leading the model complexity increased,the generalization ability decreased.Therefore,an embedded feature selection method based on selective ensemble is proposed,according to the selective ensemble strategy to ensemble part of feature selectors,and then through the combination method of improved sequence forward search and wrapper secondary search optimal feature subset.Experimental results show that the proposed algorithm can reduce the complexity of feature subset effectively while ensuring the classification performance,so as to achieve the optimal balance of the classification performance,efficiency and stability.
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28