检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机科学与应用》2024年第10期85-101,共17页Computer Science and Application
摘 要:深度聚类通过联合深度学习和传统的聚类方法,可以有效解决高维数据聚类问题,在数据处理领域受到广泛关注,然而,需要花费大量计算资源的深度聚类模型往往会制约其研究发展乃至应用。因此,本文针对深度聚类模型训练耗费时间过长的问题,从减少单次迭代时间和缩短达到期望精度的迭代次数两个思路去探索提高模型训练效率的方法,分别提出了基于随机采样策略的深度K-means (Deep K-means based on Random Sampling Strategy, RSDK)和基于正交变换特征的二阶段深度K-means (Two Stage Deep K-means based on Orthogonal Transform Features, OTDK),前者利用随机采样策略优化深度聚类模型,通过减少单次纪元需要处理的数据量以缩短其耗费的时间,致使在相同纪元数的条件下模型总的训练时间减少。后者则是从训练策略、损失函数、网络架构多个角度对深度聚类模型进行改进,企图让模型参数经历较少的更新次数就令其聚类结果达到预期。最终在MNIST、F-MNIST、CIFAR-10三个数据集验证所提出的两种改进算法,可以发现RSDK所耗费的训练时间会随着采样率下降而下降,而OTDK在MNIST数据集上可以让模型参数花费较少的更新次数就获得较高的聚类精度,虽然在另外两个数据集上获得的聚类精度还未能处于非常优越的水准,但与RSDK相比无明显差异,且模型具有收敛较快的优点。Deep clustering, by combining deep learning and traditional clustering methods, can effectively solve the problem of high-dimensional data clustering and has received widespread attention in the field of data processing. However, deep clustering models that require a large amount of computational resources often constrain their research and development, and even their applications. Therefore, this article explores methods to improve the training efficiency of deep clustering models by reducing the single iteration time and shortening the number of ite
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.138.199.24