基于多层MapReduce的混合网络流量分类特征选择方法  被引量:1

Hybrid network traffic classification feature selection method based on multilayer MapReduce

在线阅读下载全文

作  者:王勇[1,2] 龙也[1] 陶晓玲[3,2] 韦毅[3] 

机构地区:[1]桂林电子科技大学计算机科学与工程学院,广西桂林541004 [2]桂林电子科技大学广西可信软件重点实验室,广西桂林541004 [3]桂林电子科技大学信息与通信学院,广西桂林541004

出  处:《桂林电子科技大学学报》2016年第2期123-128,共6页Journal of Guilin University of Electronic Technology

基  金:国家自然科学基金(61163058;61363006);广西可信软件重点实验室开放基金(KX201306)

摘  要:针对传统的特征选择方法只适用于小规模数据集、运行效率低的缺陷,结合Filter方法和Wrapper方法的特点,提出一种基于多层MapReduce的混合网络流量分类特征选择方法。该方法通过Fisher score对数据进行预处理,剔除部分无关特征,实现高维数据的降维。采用序列前向搜索的搜索策略,通过多层MapReduce实现不断选取分类能力最好的特征。实验结果表明,该方法既保持较高的分类精度,又减少特征选择时间,实现较好的加速比,提高了网络流量分类的执行效率。The traditional feature selection method is only suitable for small scale datasets and the operating efficiency is low, combining the feature of Filter and Wrapper, a hybrid network traffic classification feature selection method based on multilayer MapReduce is proposed. In this method, Fisher score is used to preprocess the data, the part of unrelated feature is removed and the dimensionality is reduced. Then seg, uential forward search strategy is adopted, and the best feature for classi fication is selected constantly by multilayer MapReduce. The experimental results show that this method can not only keep the high classification accuracy, but also reduce the feature selection time. Meanwhile, it can get a nice speedup ratio and increase the efficiency of network traffic classification.

关 键 词:特征选择 FISHER SCORE SFS MAPREDUCE 

分 类 号:TP301.1[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象