检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孙晶
机构地区:[1]太原科技大学计算机科学与技术学院
出 处:《数字技术与应用》2024年第5期223-225,共3页Digital Technology & Application
摘 要:在实际问题中,进行聚类分析的数据点常常受到很多因素的影响。本文针对多因素影响下的聚类问题,提出了K-Hybrids聚类算法,该算法考虑了聚类过程中点的权重差异,以及数据点所属标签相似度的问题。用加权K-means算法对聚类过程进行调整,同时用基于独热编码的Jaccard相似度计算数据点之间的逻辑距离,最后引入权重因子对这两个影响因素进行整合。实验结果显示,该算法的聚类效果很好,更具有实际意义。大数据时代下,数据的产生、采集方式日新月异,对数据的处理技术也在飞速发展,如何提高对数据的处理速度、优化处理流程一直是人们研究的主要内容。
关 键 词:聚类算法 权重因子 标签相似度 聚类分析 处理流程 聚类效果 聚类过程 逻辑距离
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.137.210.169