检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:顾兆军[1] 吴优 赵春迪 周景贤[1] GU Zhaojun;WU You;ZHAO Chundi;ZHOU Jingxian(Information Security Evaluation Center of Civil Aviation,Civil Aviation University of China,Tianjin 300300,China;Sino-European Institute of Aeronautical Engineering,Civil Aviation University of China,Tianjin 300300,China;College of Computer Science and Technology,Civil Aviation University of China,Tianjin 300300,China)
机构地区:[1]中国民航大学信息安全测评中心,天津300300 [2]中国民航大学中欧航空工程师学院,天津300300 [3]中国民航大学计算机科学与技术学院,天津300300
出 处:《计算机工程与应用》2020年第6期86-91,共6页Computer Engineering and Applications
基 金:民航安全能力建设项目(No.PESA170003,No.PESA2018082);中央高校基本科研业务费中国民航大学专项(No.3122018C036)
摘 要:针对传统基于机器学习的流量分类方法中数据不均衡影响分类效果的问题,提出了一种基于重采样的梯度增强树算法。该算法利用流量数据的统计特征,通过回溯搜索策略优化特征集合并设计适用于流量分类的树结构参数,构造最优模型;利用结合重采样的LightGBM算法修正数据不平衡性并进行分类测试。经实验验证,该算法提高了不平衡数据的分类效果,并且具有性能稳定、快速的优点。Since the data imbalance affects the accuracy of the traffic classification based on machine learning,a traffic classification algorithm based on ensemble learning and resampling RES-LGBM is tailored.The algorithm uses statistical features of traffic flows,and optimizes the feature set by backtracking search method.After determination of optimal tree structure,the RES-LGBM is employed to eliminate the data imbalance and test the classification result.The test result shows that the algorithm enhances the classification of imbalanced data with high efficiency and stablility.
关 键 词:机器学习 集成学习 数据不平衡 网络流量 重采样
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.169