基于MapReduce的数据挖掘平台设计与实现被引量：45

Design and implementation of MapReduce-based data mining platform

机构地区：[1]中国科学院软件研究所软件工程技术中心,北京100190 [2]中国科学院研究生院,北京100190 [3]解放军卫生信息中心,北京100842

出　　处：《计算机工程与设计》2013年第2期495-501,共7页Computer Engineering and Design

基　　金：国家科技重大专项核高基基金项目(2010ZX01042-001-001-05);国家科技支撑计划基金项目(2012BAH05F02;2011BAH15B03)

摘　　要：MapReduce编程模型的简单性和高性价比使得其适用于海量数据的并行处理。然而,MapReduce欠缺对多数据源、组件复用以及数据可视化支持,这些缺点使用户在运用MapReduce框架进行数据挖掘时暴露出开发效率低下,重复开发等问题。提出了一种基于MapReduce的数据挖掘平台的设计与实现,该设计思想为Hadoop作为大规模数据计算平台在数据挖掘、数据可视化以及商业智能应用方面的不足提供了参考与弥补。同时,基于该方法实现了一个大规模数据挖掘工具。Profiting from its simplicity and high cost performance, MapReduce programming paradigm is suitable for massive parallel data processing. However, MapReduee＇s lacking supports for multiple data source, component reuse, and data visua lization bring in problems such as low efficiency development and redundant coding. A new design and implementation of MapRe ducebased data mining platform is proposed to give reference implementation of massive data mining, data visualization and busi ness intelligence applications based on Hadoop. Based on this proposal, a massive data mining tool is implemented.

关键词：MapReduce编程模型数据挖掘 HADOOP平台模型驱动可视化

分类号：TP301[自动化与计算机技术—计算机系统结构]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于MapReduce的数据挖掘平台设计与实现被引量：45

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于MapReduce的数据挖掘平台设计与实现 被引量：45

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于MapReduce的数据挖掘平台设计与实现被引量：45