检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]安徽职业技术学院信息工程系,合肥230011 [2]合肥工业大学管理学院,合肥230009
出 处:《西安文理学院学报(自然科学版)》2017年第3期18-20,32,共4页Journal of Xi’an University(Natural Science Edition)
基 金:国家自然科学青年基金:"基于多重分形和文本数据流技术的网络金融信息动态挖掘研究"(71301041)
摘 要:聚类算法作为机器学习领域的一个至关重要的算法体系,已经被深入研究和广泛使用了很多年,其主要研究内容集中在用相似距离作为依据,其中Kmeans算法应用极为广泛,被添加到各种数据挖掘软件包中.传统的Kmeans算法不能满足今天大数据环境下的应用,文中利用Spark技术将其改进为并行化的设计思想并进行优化.As one of the most important algorithms in the field of machine learning, clustering algorithm has been studied and widely used for many years. The main research content is based on the similarity distance, in which the Kmeans algorithm is widely used and is added to various data mining software packages. The traditional Kmeans algorithm can not meet the needs of today's big data environment, in this paper, we use Spark technology to improve the design idea and optimize it.
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3