基于Hadoop的并行化聚类系统的设计  

在线阅读下载全文

作  者:张友海[1] 李锋刚[2] 

机构地区:[1]安徽职业技术学院信息工程系,安徽合肥230011 [2]合肥工业大学管理学院,安徽合肥230009

出  处:《赤峰学院学报(自然科学版)》2016年第9期15-16,共2页Journal of Chifeng University(Natural Science Edition)

基  金:国家自然科学青年基金项目资助(71301041)

摘  要:数据挖掘技术可以找出大量数据中的隐含的价值并对数据做作出预测.聚类分析是挖掘数据价值的重要手段之一,在识别数据的内在相似性具有极其重要的作用.近些年来,随着互联网技术的飞跃式发展,各行各业产生的数据以爆炸式的增长.面对如此庞大的数据量,传统的数据挖掘处理方式已经无法胜任,而以Hadoop生态圈为代表的大数据处理方法,提供了成熟且易用的工具技术支撑.因此,基于Hadoop相关工具来设计一种并行化聚类系统具有非常重要的意义.

关 键 词:数据挖掘 聚类分析 HADOOP 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象