基于Hadoop平台的数据挖掘算法的研究  被引量:4

在线阅读下载全文

作  者:王红勤[1] 潘正军 袁丽娜[1] 

机构地区:[1]广州大学华软软件学院

出  处:《电脑知识与技术》2019年第8Z期9-11,共3页Computer Knowledge and Technology

基  金:广东省创新强校工程科研项目(粤教科函[2019]68号,项目编号:2018KQNCX393);2017年广东省教改项目(编号:粤教高函[2018]1号);2018年广州大学华软软件学院科研项目(ky201816,ky201809);2019年广州大学华软软件学院质量工程项目(JXTD201901)

摘  要:在深入分析传统数据挖掘方案已经不能满足大数据的挖掘任务的基础上,为了提高大数据环境下的数据挖掘速度,对分布式计算构架Hadoop进行分析与研究。文中搭建了Hadoop云计算平台的数据挖掘系统,对数据挖掘算法中聚类算法K-Means进行了设计,在Hadoop平台上实现了K-Means算法的优化,使用Hadoop分布式系统进行数据挖掘任务具有良好的效率,分析结果表明了其具有较大的潜力。

关 键 词:数据挖掘算法 大数据 HADOOP平台 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象