不平衡数据分类

作品数:112被引量:859H指数:15
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:尹军梅蒋盛益谢照青胡小生黄勃更多>>
相关机构:重庆邮电大学重庆大学西安电子科技大学华南理工大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金新疆维吾尔自治区科技支疆项目山西省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
软件缺陷预测中不平衡数据分类算法研究
《信息技术》2024年第12期149-158,166,共11页张健 姜虹 
陕西高等职业教育教学改革研究项目(21GY047);汉中职业技术学院教学研究与改革项目(HZZYJY2021003,HZZYGL-2021004)。
针对不平衡数据导致软件缺陷预测准确率低的问题,文中提出一种多层次自适应判断合成随机过采样(AJCC-Ram)结合XGBoost集成学习的不平衡数据分类方法(简称XG-AJCC)。该模型采用AJCC-Ram方法和XGBoost方法分别进行不平衡数据预处理和数据...
关键词:AJCC-Ram XGBoost集成学习 过采样 不平衡数据分类 软件缺陷预测 
面向不平衡数据分类的DPC-SMOTE过采样算法
《哈尔滨理工大学学报》2024年第6期45-60,共16页刘志函 张忠林 赵磊 
国家自然科学基金(61662043);甘肃省自然科学基金(21JR7RA288).
针对不平衡数据集中存在的噪声以及类内类间不平衡问题,提出了基于密度峰值聚类过采样算法。首先对多数类样本进行预处理,筛选噪声样本并删除;其次,对所有少数类样本采用密度峰值聚类,剔除噪声点;再次,根据聚类后每个簇不同的稀疏度分...
关键词:不平衡数据 分类 过采样 密度峰值聚类 稀疏度 
一种基于不平衡数据的矿用脱介筛故障监测方法
《洁净煤技术》2024年第S02期78-81,共4页杨军 栗轩华 张雷云 
矿用设备故障监测对提高煤矿生产的连续性和安全性具有重要意义,但是由于实际工业过程中故障数据稀少且难以采集,造成了不平衡问题,对基于数据的故障监测算法实际应用不利。本文针对实际设备故障监测中少数类样本集的类内不平衡问题,提...
关键词:LOF Borderline-SMOTE 不平衡数据分类 过采样 脱介筛故障监测 
基于联合熵的非平衡数据边界混合重采样
《计算机与现代化》2024年第9期95-100,113,共7页周传华 任太娇 罗岚 周昊 
国家自然科学基金资助项目(71772002,61702006);复杂系统多学科管理与控制安徽普通高校重点实验室资助项目(CS2020-04)。
为了克服在数据平衡处理过程中单一重采样方法易生成冗余样本及误删重要样本信息的局限,本文提出一种基于联合熵的非平衡数据边界混合重采样算法。该算法首先通过引入边界因子对边界集和非边界集进行有效的区分,进一步构建一个联合熵指...
关键词:不平衡数据分类 边界因子 联合熵 混合采样 
面向不平衡数据的提升均衡集成学习算法
《山东大学学报(工学版)》2024年第4期59-66,共8页白琳 俱通 王浩 雷明珠 潘晓英 
陕西省重点研发计划资助项目(2023-YBSF-476);西安邮电大学创新基金资助项目(CXJJYL2022043)。
为有效解决欠采样技术在处理不平衡数据时的伪平衡问题,提出并设计一种基于欠采样的提升均衡集成学习算法。采用新的均衡采样机制,通过分箱操作协调数据的预测概率,生成高质量的训练子集,以此迭代训练分类器。基于基分类器在原始数据上...
关键词:欠采样 类不平衡 不平衡学习 集成学习 不平衡数据分类 
基于样本势和噪声进化的不平衡数据过采样方法被引量:2
《计算机应用》2024年第8期2466-2475,共10页冷强奎 孙薛梓 孟祥福 
国家自然科学基金资助项目(61602056,61772249);辽宁省自然科学基金资助项目(2019-ZD-0493);辽宁省教育厅科研项目(LQ2019012);辽宁工程技术大学博士科研启动基金资助项目(21-1043)。
在处理不平衡数据分类问题中,过采样方法是一种有效的策略。现有方法大多采用K近邻(KNN)技术选取采样种子样本,但KNN参数值的改变会导致多数过采样方法表现出明显的不适定性。径向基过采样(RBO)方法能解决这个问题,但在采样后易出现大...
关键词:K近邻 径向基过采样 样本势 自然近邻 差分进化 不平衡数据分类 
针对不平衡数据分类的改进GBDT算法
《计算机与数字工程》2024年第7期1932-1937,1943,共7页李长洪 郑凯 林博宇 
中国高校产学研创新基金(编号:2020ITA05033)资助。
许多传统的分类算法在处理不平衡数据时,训练出的分类器对多数类别样本预测准确率较高,而对少数类别样本的预测准确率较低。针对这一问题,提出一种改进的梯度提升决策树(GBDT)算法用于处理不平衡数据的二分类问题。数据层面,用自适应综...
关键词:不平衡数据 梯度提升决策树 自适应综合过采样 焦点损失函数 随机子采样 
基于改进Switching集成算法的具有类间重叠不平衡数据分类
《系统工程》2024年第3期136-148,共13页张建同 李君昌 王来 樊重俊 
国家自然科学基金资助项目(71971156,72371188);同济大学中央高校基本科研业务专项(22120210241);中国国家留学基金管理委员会资助项目(202206260238)。
准确识别具有类间重叠的不平衡数据类别有着重要的理论意义与应用价值。首先,基于Switching集成学习框架,结合样本类间重叠度和邻域分布信息,定义了样本类别待转换的概率,进而提出了一种针对具有类间重叠的不平衡数据分类的集成学习算法...
关键词:不平衡数据分类 类间重叠 邻域分布 Switching算法 
基于聚类算法的不平衡数据分类
《中国信息界》2024年第5期164-166,共3页林肖莹 胡敏杰 张勇 
基于聚类算法的不平衡数据的分类研究,福建省教育厅科技项目(JAT200318);面向层次结构数据的特征选择方法研究,福建省自然科学基金项目(2021J011006)。
引言现有的不平衡数据分类问题通常采用重采样和重加权等类重平衡策略,使决策边界倾向于准确分类尾部类的数据。但在类重平衡策略实施后,每个类别的类内分布变得更加松散,损害了深层特征的代表能力。因此,本文提出采用多粒度数据增强策...
关键词:不平衡数据分类 聚类算法 平衡策略 多粒度 重采样 类内分布 数据增强 策略生成 
基于多准则决策的不平衡感知数据集成特征选择算法
《传感器技术与应用》2023年第6期538-549,共12页王刚 任丽萍 方力 徐维磊 
在数据挖掘领域,不平衡数据普遍存在。在许多情况下,这些数据通常具有高维性和类不平衡性。不平衡数据集特征属性分布失衡,会造成分类性能下降,数据的高维性则会导致学习算法非常耗时。针对这一问题,提出了一种基于组合采样和集成学习...
关键词:不平衡数据分类 组合采样 多准则决策 VIKOR法 前向序列选择 
检索报告 对象比较 聚类工具 使用帮助 返回顶部