不平衡数据

作品数:971被引量:3724H指数:28
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘三阳赵小强蒋盛益张化祥杨明更多>>
相关机构:西安电子科技大学华南理工大学重庆邮电大学南京邮电大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金教育部人文社会科学研究基金江苏省自然科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 学科=自动化与计算机技术—计算机软件与理论x
条 记 录,以下是1-10
视图:
排序:
多判别器生成对抗网络工业不平衡数据建模方法
《计算机集成制造系统》2025年第2期554-566,共13页赵佳 杨澜 刘勤学 
国家自然科学基金资助项目(12001153)。
为解决工业场景下不平衡数据建模预测精度较低的问题,提出结合多判别器生成对抗网络及反聚类筛选的工业不平衡数据建模方法来增强模型分类预测效果。针对生成对抗网络模型在训练过程中存在模式崩溃,导致生成数据多样性差的问题,基于集...
关键词:工业不平衡数据 生成对抗网络 生成数据筛选 信息熵 矿热炉 电极升降 带钢缺陷识别 
不平衡数据集中采样比例对分类结果影响的研究
《智能计算机与应用》2024年第9期111-117,共7页许思为 周明 邹瑞 刘吉华 吴俊平 秦雨露 
各领域的发展伴随着大量不同类别数据的产生,数据集样本类别往往存在不平衡的特点,特别是医疗、金融和工业领域的数据集,以往研究专注于采样的方法和分类算法。本文针对不平衡数据集的分类问题,按原始比例抽取验证数据集,对余下数据根...
关键词:重采样 不平衡数据集 采样比例 召回率 精确率 
面向类不平衡数据集的重采样方法影响研究
《现代计算机》2024年第14期36-40,共5页丁浩杰 
2022年度山西省教育厅高等学校科技创新项目(2022L621)。
为了评估重采样方法对类不平衡数据集的影响,对被广泛使用的美国威斯康星州的乳腺癌诊断数据集进行研究,基于逻辑斯特回归、支持向量机、随机森林等三种机器学习算法进行实验,对随机上采样抽样、随机下采样抽样、SMOTE以及ADASYN四种重...
关键词:重采样方法 随机下采样抽样 支持向量机 逻辑斯特回归 随机森林 
基于ICA改进ICEEMD的UDS重采样数学模型
《计算机仿真》2024年第7期535-539,共5页徐莎莎 胡靖 吕牡丹 
2022年江西省南昌市江西科技学院校级教育教学课题项目(JY2102)。
为了增强不平衡数据集处理效果,提出一种基于ICA改进ICEEMD的不平衡数据集重采样数学模型研究方法。分析不平衡数据集的分布特征,通过改进完备集成经验模态分解(ICEEMD)方法和独立分量分析(ICA)分解不平衡数据集,去除不平衡数据集中的...
关键词:不平衡数据集 重采样 数学模型构建 聚类算法 
基于自适应惯性权重PSO-LightGBM的信用风险评估研究被引量:1
《云南民族大学学报(自然科学版)》2024年第3期345-350,共6页付芷宁 李慧敏 徐亚田 陶玉虎 高伟 
云南省研究生优质课程建设项目(云学位[2022]8号).
贷款市场复杂的个人信用风险问题中,信用风险评估模型的构建是十分关键的一步.利用Lending Club数据集,进行信用风险评估模型的构建来预测客户的违约概率.首先进行数据处理,再通过合成少数类过采样技术(SMOTE)算法处理数据正负样本不平...
关键词:信用风险 不平衡数据 合成少数类过采样技术 LightGBM模型 粒子群优化算法 
SMOTE类算法研究综述被引量:4
《计算机科学与探索》2024年第5期1135-1159,共25页王晓霞 李雷孝 林浩 
国家自然科学基金(62362055);内蒙古自治区重点研发与成果转化计划项目(2022YFSJ0013,2023YFHH0052);内蒙古自治区高等学校青年科技英才支持计划项目(NJYT22084);内蒙古自然科学基金(2023MS06008);内蒙古自治区科技成果转化专项资金项目(2020CG0073,2021CG0033)。
合成少数类过采样技术(SMOTE)因能有效处理少数类样本已成为处理不平衡数据的主流方法之一,而且许多SMOTE改进算法已被提出,但目前已有的调研极少考虑到流行的算法级改进方法。因此对现有SMOTE类算法进行更全面的分析与总结。首先详细...
关键词:不平衡数据 合成少数类过采样技术(SMOTE) 过采样 监督学习 
基于权重距离的优势边界小类样本合成算法
《闽南师范大学学报(自然科学版)》2024年第1期54-64,共11页何田中 郑艺峰 胡敏杰 
国家自然科学基金项目(62376114);福建省自然科学基金项目(2021J011003,2021J011004,2021J011006)。
提出基于权重距离的优势边界小类样本合成算法(ABWD)来克服数据类别不平衡的问题.ABWD算法具有如下特点:1)定义权重距离,并基于该距离选取样本近邻;2)根据样本近邻确定该样本是否为小类的边界样本;3)对每个小类的边界样本确定其合成位...
关键词:数据挖掘 不平衡数据 过抽样 优势边界 权重距离 
基于Optuna框架的L_(p)范数约束下多核支持向量机在违约风险预测中的应用
《现代电子技术》2024年第6期147-153,共7页郑怡昕 王重仁 
山东省科技型中小企业创新能力提升工程(2023TSGC0208)。
针对违约数据存在数据量大、维度多、不平衡及噪声大等缺点,提出一种改进的支持向量机方法,即基于Optuna框架的L_(p)范数约束的代价敏感的多核支持向量机(L_(p)-Optuna-SVM)。该方法采用成本矩阵对不同预测错误赋予不同数值,通过多核学...
关键词:多核支持向量机 Optuna优化框架 L_(p)范数约束 多核学习 不平衡数据集 违约风险预测 
不平衡数据下基于SVM增量学习的指挥信息系统状态监控方法
《系统工程与电子技术》2024年第3期992-1003,共12页焦志强 易侃 张杰勇 姚佩阳 
针对指挥信息系统历史状态样本有限的特点,基于支持向量机(support vector machines,SVM)设计了一种面向不平衡数据的SVM增量学习方法。针对系统正常/异常状态样本不平衡的情况,首先利用支持向量生成一部分新样本,然后通过分带的思想逐...
关键词:指挥信息系统 系统监控 支持向量机 不平衡数据 增量学习 
基于构造性神经网络与全局密度信息的不平衡数据欠采样方法被引量:3
《计算机科学》2023年第10期48-58,共11页严远亭 马迎澳 任艳平 张燕平 
国家自然科学基金(61806002)。
多数类欠采样是当前数据层面解决不平衡数据学习的主流技术之一,近年来,研究者们提出了一系列的欠采样方法,但大多都将重点放在如何选择代表性的样本,从而降低信息损失。然而,如何在欠采样过程中保持多数类内部的结构信息,仍然是欠采样...
关键词:欠采样 不平衡数据 分布密度 构造性神经网络 集成学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部