分类型数据

作品数:21被引量:119H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:宋玲孙浩军赵立江杜育林洪亮亮更多>>
相关机构:汕头大学山西大学广西大学徐州师范大学更多>>
相关期刊:《计算机工程与设计》《山东大学学报(工学版)》《数字技术与应用》《计算机工程与应用》更多>>
相关基金:国家自然科学基金江苏省高校自然科学研究项目广东省自然科学基金山西省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
一种针对分类型数据的熵特征变换FCM聚类算法
《数字技术与应用》2024年第1期57-59,共3页刘晋胜 周靖 
论文受广东省科技大专项目资助(mmkj2020033);广东省普通高校特色创新类项目(2018KTSCX153)资助;广东省普通高校特色创新类项目(2021KTSCX076)资助。
针对分类型数据导致聚类性能下降的问题,本文提出一种新的熵特征变换FCM聚类算法。首先根据熵的数学描述形式,定义分类型数据参数的熵特征值,进而生成熵特征变换模型及其增量模型;接着定义模型的矩阵“痕迹”,获取EFTM模型数据的特征集...
关键词:分类型数据 变换模型 增量模型 描述形式 特征提取 特征集合 FCM聚类算法 定义模型 
PLDP:收集和分析多维数据的个性化LDP
《计算机科学与探索》2023年第4期964-972,共9页谷香 李艳辉 袁野 李新玲 王国仁 
国家自然科学基金(62002036);重庆市教委项目(KJQN202000707)。
众包应用的普及加速了企业的发展,随之而来的隐私泄露问题已经成为公众关注的焦点。现有的本地化差分隐私(LDP)机制主要关注单个隐私级别的效用优化,这会导致某些用户因提供的隐私保护级别不足拒绝共享数据,而某些用户则获得过多的隐私...
关键词:本地化差分隐私(LDP) 个性化本地差分隐私(PLDP) 数值型数据 分类型数据 众包 
结合柯西核的分类型数据密度峰值聚类算法被引量:4
《计算机工程与应用》2022年第18期162-171,共10页盛锦超 杜明晶 李宇蕊 孙嘉睿 
国家自然科学基金(62006104,61872168);江苏省高校自然科学基金(20KJB520012)。
密度峰值聚类算法在处理分类型数据时难以产生较好的聚类效果。针对该现象,详细分析了其产生的原因:距离计算的重叠问题和密度计算的聚集问题。同时为了解决上述问题,提出了一种面向分类型数据的密度峰值聚类算法(Cauchy kernel-based d...
关键词:分类型数据 有序特性 密度峰值聚类 柯西核函数 数据挖掘 
基于簇内簇间相异度的k-modes算法被引量:1
《计算机工程与设计》2021年第9期2492-2500,共9页贾子琪 宋玲 
国家自然科学基金项目(61762030);广西创新驱动重大专项基金项目(桂科AA17204017);广西重点研发计划基金项目(桂科AB19110050、桂科AB18126094)。
为提高k-modes算法的精度并解决初始簇中心选择问题,提出一种基于簇内簇间相异度的k-modes算法(IKMCA)。基于簇内簇间相似性对相异度系数进行改进,给出初始簇中心自主选择的具体方法。提出的簇内簇间相异度系数考虑特征值本身的相异性...
关键词:k模式算法 簇内簇间相似性 分类型数据 频率 相异度系数 
无人仓系统订单分批问题及K-max聚类算法被引量:15
《计算机集成制造系统》2021年第5期1506-1517,共12页李珍萍 田宇璇 卜晓奇 吴凌云 
国家自然科学基金资助项目(71771028);北京市自然科学基金资助项目(Z180005,9212004);北京市属高校高水平科研创新团队建设资助项目(IDHT20180510);北京市高校高水平人才交叉培养项目“实培项目”;北京市智能物流协同创新中心开放课题资助项目(BILSCIC-2019KF-18);北京物资学院校级重大资助项目(2019XJZD09);北京市科技创新服务能力建设—高精尖学科建设资助项目。
为了提高订单拣选效率、降低拣选成本,研究了以自动引导小车(AGV)为搬运工具的无人仓库系统订单分批问题。分析了影响订单拣选成本和效率的两种主要因素,建立了以订单分批拣选总成本极小化为目标的整数规划模型。根据K-means聚类算法思...
关键词:无人仓 货到人 订单分批 分类型数据 取大运算 K-max聚类算法 加权距离 
一种面向混合型数据聚类的k-prototypes聚类算法被引量:7
《小型微型计算机系统》2020年第9期1845-1852,共8页贾子琪 宋玲 
国家自然科学基金项目(61762030)资助;广西创新驱动重大专项项目(桂科AA17204017)资助;广西重点研发计划项目(桂科AB19110050,桂科AB18126094)资助。
同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高...
关键词:k-prototypes 混合型相异度系数  分类型数据 数值型数据 混合型数据 
SMOTE过采样及其改进算法研究综述被引量:64
《智能系统学报》2019年第6期1073-1083,共11页石洪波 陈雨文 陈鑫 
国家自然科学基金资助项目(61801279);山西省自然科学基金项目(201801D121115,2014011022-2)
近年来不平衡分类问题受到广泛关注。SMOTE过采样通过添加生成的少数类样本改变不平衡数据集的数据分布,是改善不平衡数据分类模型性能的流行方法之一。本文首先阐述了SMOTE的原理、算法以及存在的问题,针对SMOTE存在的问题,分别介绍了...
关键词:不平衡数据分类 SMOTE 算法 K-NN 过采样 欠采样 高维数据 分类型数据 
基于k-modes聚类的不平衡数据混合采样方法被引量:1
《济南大学学报(自然科学版)》2017年第6期499-505,共7页张艳 江峰 杜军威 刘国柱 眭跃飞 
国家自然科学基金项目(61273180;61402246);山东省自然科学基金项目(ZR2014FM015;ZR2012FL17);山东省高等学校科技计划项目(J11LG05)
针对现有的不平衡数据处理方法存在不能有效处理分类型数据、盲目采样及抗噪声能力差等问题,提出一种基于k-modes聚类的不平衡数据混合采样算法HS_WODKM;首先提出一种基于加权重叠距离的k-modes聚类算法WODKM,然后采用改进的合成少数过...
关键词:不平衡数据 分类型数据 k-modes聚类 过采样技术 混合采样 
基于结构相似性的k-modes算法被引量:2
《计算机工程与应用》2017年第23期102-107,共6页黄苑华 谢峰 郝志峰 蔡瑞初 
国家自然科学基金(No.61472089);广东省自然科学基金(No.2014A030308008);软件新技术国家重点实验室开放课题(No.KFKT2014B23)
聚类是数据挖掘中重要的技术之一,它是按照相似原则将数据进行分类。然而分类型数据的聚类是学习算法中重要而又棘手的问题。传统的k-modes算法采用简单的0-1匹配方法定义两个属性值之间的相异度,没有将整个数据集的分布考虑进来,导致...
关键词:聚类分析 分类型数据 相异度度量 结构相似性 k-modes算法 
教学评价数据的离群点检测算法研究被引量:1
《软件》2017年第4期18-25,共8页李慧 王国强 郭瑞强 高静伟 暴延敏 
河北师范大学教改课题资助(2015XJJG023)
教学评价是大学教学活动中不可缺少的环节,可能出现故意抬高或压低评分及虚假评分的现象,应该找出这些离群数据并加以清除,以提高学生评教数据的正确性。离群点检测问题是数据挖掘技术的重要研究领域之一,本文实验所用教学评价数据属于...
关键词:离群点检测 k-modes聚类 余弦相似度 分类型数据 
检索报告 对象比较 聚类工具 使用帮助 返回顶部