严远亭

作品数:14被引量:63H指数:5
导出分析报告
供职机构:安徽大学更多>>
发文主题:过采样不平衡数据邻域信息不完整数据不平衡更多>>
发文领域:自动化与计算机技术文化科学更多>>
发文期刊:《计算机研究与发展》《计算机教育》《南京大学学报(自然科学版)》《计算机工程与应用》更多>>
所获基金:国家自然科学基金安徽大学博士科研启动基金安徽省自然科学基金国家级质量工程项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
学习困难与泛化能力感知的软件缺陷预测过采样方法
《计算机集成制造系统》2024年第8期2663-2671,共9页范洪旗 严远亭 张以文 张燕平 
国家自然科学基金资助项目(61806002,62272001)。
软件缺陷数据的类别分布不平衡特点给软件缺陷预测任务带了巨大的挑战。合成过采样是解决这一问题最为主流的技术,但如何设计合适的采样策略避免因引入异常样本而导致的过度泛化风险,始终是软件缺陷预测过采样方法面临的难点。针对这一...
关键词:软件缺陷预测 类别不平衡 过采样 过度泛化 
基于前景理论的软件缺陷预测过采样方法
《计算机集成制造系统》2024年第8期2822-2831,共10页徐彪 严远亭 张以文 
国家自然科学基金资助项目(61806002,62272001)。
在软件缺陷预测中,数据困难因子对预测性能的影响比类不平衡更为明显。然而,大多数现有软件缺陷预测过采样方法在解决类不平衡问题过程中,忽视了软件项目数据集固有的数据困难因子,从而导致预测性能不佳。针对上述问题,提出一种基于前...
关键词:软件缺陷预测 类不平衡 数据困难因子 过采样 前景理论 
邻域信息修正的不完整数据多填充集成分类方法被引量:2
《计算机工程与应用》2023年第23期125-135,共11页朱先远 严远亭 张燕平 
国家自然科学基金(61872002,62272001);安徽高校自然科学研究重点项目(KJ2021A1483,2022AH052740,2023AH052296)。
不完整数据集分类前需要对缺失值先填充。目前已有了一些经典的缺失值填充算法,如均值填充、K近邻填充等。它们各有优势,但这些算法对缺失值的估算易受到与缺失值相关性不大的其他数据干扰,影响缺失值填充效果,进而影响后续分类性能。...
关键词:不完整数据分类 修正填充 邻域信息 集成学习 
基于构造性神经网络与全局密度信息的不平衡数据欠采样方法被引量:3
《计算机科学》2023年第10期48-58,共11页严远亭 马迎澳 任艳平 张燕平 
国家自然科学基金(61806002)。
多数类欠采样是当前数据层面解决不平衡数据学习的主流技术之一,近年来,研究者们提出了一系列的欠采样方法,但大多都将重点放在如何选择代表性的样本,从而降低信息损失。然而,如何在欠采样过程中保持多数类内部的结构信息,仍然是欠采样...
关键词:欠采样 不平衡数据 分布密度 构造性神经网络 集成学习 
融合后验概率和密度的不平衡数据欠采样方法被引量:5
《计算机工程与应用》2022年第23期268-277,共10页任艳平 郑重 江一飞 严远亭 张燕平 
国家自然科学基金(61806002,61872002)。
欠采样是当前解决类不平衡问题的主流方法之一。现有研究表明,高效地处理类别重叠能够有效提升过采样方法的性能。然而,目前对欠采样的研究大多认为由于样本选择策略不当而导致的关键样本丢失是影响欠采样方法性能的主要原因,为此,研究...
关键词:不平衡数据 欠采样 贝叶斯后验概率 全局分布密度 集成分类 信息熵 
邻域感知的不平衡数据集过采样方法被引量:7
《小型微型计算机系统》2021年第7期1360-1370,共11页严远亭 戴涛 张以文 赵姝 张燕平 
国家自然科学基金项目(61806002,61673020,61872002,61876001)资助;安徽大学博士科研启动基金项目(J01003253)资助。
不平衡数据学习是机器学习中一个研究热点,近年来得到广泛的关注.以SMOTE为代表的过采样方法是不平衡数据学习的主流方法之一,近年来涌现出大量的基于SMOTE的改进过采样方法.但是,当前对过采样的研究中,如何利用样本分布信息,实现高效...
关键词:不平衡学习 过采样 SMOTE 邻域信息 噪声样本 
构造性覆盖算法的SMOTE过采样方法被引量:9
《计算机科学与探索》2020年第6期975-984,共10页严远亭 朱原玮 吴增宝 张以文 张燕平 
国家自然科学基金,Nos.61806002,61673020,61872002;安徽大学博士科研启动基金。
如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数...
关键词:不平衡数据 过采样技术 合成少数类过采样技术(SMOTE) 构造性覆盖算法(CCA) 
构造性覆盖下不完整数据修正填充方法被引量:5
《智能系统学报》2019年第6期1225-1232,共8页严远亭 吴亚亚 赵姝 张燕平 
国家自然科学基金项目(61806002,61872002,61673020,61876001,61602003);安徽省自然科学基金项目(1708085QF143,1808085MF197);安徽大学博士科研启动基金项目(J01003253)
不完整数据处理是数据挖掘、机器学习等领域中的重要问题,缺失值填充是处理不完整数据的主流方法。当前已有的缺失值填充方法大多运用统计学和机器学习领域的相关技术来分析原始数据中的剩余信息,从而得到较为合理的值来替代缺失部分。...
关键词:不完整数据 缺失值填充 邻域信息 数据挖掘 机器学习 填充方法 单一填充 多重填充 
新工科背景下人工智能人才培养体系探究被引量:4
《巢湖学院学报》2019年第3期119-125,共7页严远亭 张以文 陈洁 张燕平 
国家级质量工程项目(项目编号:TS11483);安徽大学教学研究项目(项目编号:J10118458060)
当前我国正处于推进社会经济转型的关键时期,具有创新精神和创新能力的创新型人才是推动社会经济转型的核心支撑力,以人工智能为代表的先进技术在新经济中正发挥着越来越重要的作用。以培养创新型人才为目标的新工科建设已成为我国工程...
关键词:新工科 人工智能 培养体系 
基于覆盖随机游走算法的服务质量预测被引量:5
《计算机学报》2018年第12期2756-2768,共13页张以文 汪开斌 严远亭 陈洁 何强 李炜 
国家自然科学基金(61602003);国家科技支撑计划(2015BAK24B01);安徽省自然科学基金(1808085MF197)资助~~
随着互联网上Web服务的日益增多,面对大量功能相同的候选服务,用户希望能够选择质量最优的候选服务.然而,用户通常并不知道所有候选服务的服务质量(Quality of Service,QoS).因此,基于Web服务的历史记录预测QoS值得到了广泛关注.传统的...
关键词:服务质量 质量预测 随机游走 覆盖算法 协同过滤 
检索报告 对象比较 聚类工具 使用帮助 返回顶部