流量的集成学习与重采样均衡分类方法  被引量:3

Resampling and Boosting Techniques for Balanced Traffic Classification

在线阅读下载全文

作  者:顾兆军[1] 吴优 赵春迪 周景贤[1] GU Zhaojun;WU You;ZHAO Chundi;ZHOU Jingxian(Information Security Evaluation Center of Civil Aviation,Civil Aviation University of China,Tianjin 300300,China;Sino-European Institute of Aeronautical Engineering,Civil Aviation University of China,Tianjin 300300,China;College of Computer Science and Technology,Civil Aviation University of China,Tianjin 300300,China)

机构地区:[1]中国民航大学信息安全测评中心,天津300300 [2]中国民航大学中欧航空工程师学院,天津300300 [3]中国民航大学计算机科学与技术学院,天津300300

出  处:《计算机工程与应用》2020年第6期86-91,共6页Computer Engineering and Applications

基  金:民航安全能力建设项目(No.PESA170003,No.PESA2018082);中央高校基本科研业务费中国民航大学专项(No.3122018C036)

摘  要:针对传统基于机器学习的流量分类方法中数据不均衡影响分类效果的问题,提出了一种基于重采样的梯度增强树算法。该算法利用流量数据的统计特征,通过回溯搜索策略优化特征集合并设计适用于流量分类的树结构参数,构造最优模型;利用结合重采样的LightGBM算法修正数据不平衡性并进行分类测试。经实验验证,该算法提高了不平衡数据的分类效果,并且具有性能稳定、快速的优点。Since the data imbalance affects the accuracy of the traffic classification based on machine learning,a traffic classification algorithm based on ensemble learning and resampling RES-LGBM is tailored.The algorithm uses statistical features of traffic flows,and optimizes the feature set by backtracking search method.After determination of optimal tree structure,the RES-LGBM is employed to eliminate the data imbalance and test the classification result.The test result shows that the algorithm enhances the classification of imbalanced data with high efficiency and stablility.

关 键 词:机器学习 集成学习 数据不平衡 网络流量 重采样 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象