检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张智驹 Zhang Zhiju(School of Intelligent Information Engineering,Chongqing Aerospace Polytechnic,Chongqing 400021,China)
机构地区:[1]重庆航天职业技术学院智能信息工程学院,重庆400021
出 处:《统计与决策》2024年第8期11-16,共6页Statistics & Decision
摘 要:大多数不平衡数据过抽样方法依赖于太多参数,容易生成噪声并难以处理流形数据集。为此,文章提出了一种基于密度峰值聚类的不平衡数据过抽样方法(OVMEDPC)。首先,OVMEDPC用密度峰值聚类(DPC)来发现不平衡数据的空间结构;其次,OVMEDPC设计了一种基于密度峰值聚类的噪声过滤方法来移除噪声;最后,OVMEDPC设计了一种基于密度峰值聚类的插值技术来生成少数类的合成样本。实验证明,就随机森林分类器而言,OVMEDPC在F-measure和G-mean上优于5个先进的过抽样方法。Most oversampling methods for imbalanced data rely on too many parameters,which are easy to generate noise and difficult to handle manifold data sets.Therefore,this paper proposes an oversampling method for imbalanced data based on density peak clustering(OVMEDPC).First,OVMEDPC uses density peak clustering(DPC)to reveal the spatial structure of imbalanced data.Second,OVMEDPC designs a density peak clustering-based noise filter to remove noise.Finally,OVMEDPC designs an in-terpolation method to create synthetic minority class samples.Experiments show that in terms of random forest classifiers,OVMEDPC outperforms 5 advanced over-sampling methods on F-measure and G-mean.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.144.41.223