基于Hadoop MapReduce和粗粒度并行遗传算法的大数据聚类方法改进  被引量:3

Improvement of large data clustering method based on Hadoop MapReduce and coarse grain parallel genetic algorithm

在线阅读下载全文

作  者:郭晨晨[1] 朱红康[1] GUO Chen-Chen ZHU Hong-Kang(School of mathematics and computer science, Shanxi Normal University, Linfen 041000, China)

机构地区:[1]山西师范大学数学与计算机科学学院,山西临汾041000

出  处:《黑龙江大学工程学报》2016年第3期87-91,共5页Journal of Engineering of Heilongjiang University

基  金:山西省自然科学基金资助项目(2015011040)

摘  要:为了提高并行遗传算法在大数据聚类问题中的时间效率,通过利用粗粒度遗传算法的并行化思想,提出了Hadoop平台上基于MapReduce计算框架的粗粒度遗传算法的并行化设计。该思想主要来源于大数据体量庞大的特点,聚类算法时间消耗巨大。并行是解决算力不足的一个较为有效的方法,实验结果表明,并行化的遗传算法在处理大数据聚类时相比传统的串行化处理在时间消耗方面有明显的降低。Parallel design of coarse grain genetic algorithm based on MapReduce computing framework is proposed in the Hadoop to improve the time efficiency of parallel genetic algorithm in large data clustering, by using the idea of parallel genetic algorithm. This idea is mainly derived from the huge amount of large data, a huge amount of time consumption of clustering algorithm. Parallelism is the solution to the lack of a more effective method. Experimental results show that parallel genetic algorithm in dealing with large data clustering compared to the traditional serial processing in time consumption has decreased significantly.

关 键 词:大数据 聚类 MAPREDUCE 数据挖掘 并行 粗粒度遗传算法 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象