检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孟国庆 高源 梅颖[3,4] 卢诚波 MENG Guoqing;GAO Yuan;MEI Ying;LU Chengbo(School of Computer Science and Technology,Zhejiang Sci-Tech University,Hangzhou 310018,China;State Grid Lishui Pow-er Supply Company,Lishui 323050,China;School of Mathematics and Computer,Lishui University,Lishui 323000,China;Zhejiang Detu Network Co.,Ltd,Lishui 310011,China)
机构地区:[1]浙江理工大学计算机科学与技术学院,浙江杭州310018 [2]国网浙江省电力有限公司丽水供电公司,浙江丽水323050 [3]丽水学院数学与计算机学院,浙江丽水323000 [4]浙江得图网络有限公司,浙江丽水310011
出 处:《软件导刊》2024年第9期116-121,共6页Software Guide
基 金:国家自然科学基金项目(12171217);浙江省自然科学基金项目(LY18F030003)。
摘 要:过采样是一种通过合成新的同类样本解决数据集中类分布不平衡问题的常用方法。针对数据集中样本分布不平衡的问题,提出一种基于邻域概念的PSON算法。该算法定义每个少数类样本的影响力,依据不同影响力对少数类样本进行过采样以获得平衡数据集。在50个数据集上对8种过采样算法得到的数据集进行分类测试,通过威尔科克森符号秩检验比较7种分类性能指标,结果表明采用PSON算法后分类准确率提升显著。Oversampling is a commonly used method to solve the problem of imbalanced class distribution in a dataset by synthesizing new samples of the same class.A PSON algorithm based on neighborhood concept is proposed to address the issue of imbalanced sample distribution in the dataset.This algorithm defines the influence of each minority class sample and oversamples the minority class samples based on different influences to obtain a balanced dataset.Classification tests were conducted on datasets obtained from 8 oversampling algorithms on 50 datasets.The Wilcoxon symbol rank test was used to compare 7 classification performance indicators,and the results showed that the use of PSON algorithm significantly improved classification accuracy.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.116