检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院软件研究所软件工程技术中心,北京100190 [2]中国科学院研究生院,北京100190 [3]解放军卫生信息中心,北京100842
出 处:《计算机工程与设计》2013年第2期495-501,共7页Computer Engineering and Design
基 金:国家科技重大专项核高基基金项目(2010ZX01042-001-001-05);国家科技支撑计划基金项目(2012BAH05F02;2011BAH15B03)
摘 要:MapReduce编程模型的简单性和高性价比使得其适用于海量数据的并行处理。然而,MapReduce欠缺对多数据源、组件复用以及数据可视化支持,这些缺点使用户在运用MapReduce框架进行数据挖掘时暴露出开发效率低下,重复开发等问题。提出了一种基于MapReduce的数据挖掘平台的设计与实现,该设计思想为Hadoop作为大规模数据计算平台在数据挖掘、数据可视化以及商业智能应用方面的不足提供了参考与弥补。同时,基于该方法实现了一个大规模数据挖掘工具。Profiting from its simplicity and high cost performance, MapReduce programming paradigm is suitable for massive parallel data processing. However, MapReduee's lacking supports for multiple data source, component reuse, and data visua lization bring in problems such as low efficiency development and redundant coding. A new design and implementation of MapRe ducebased data mining platform is proposed to give reference implementation of massive data mining, data visualization and busi ness intelligence applications based on Hadoop. Based on this proposal, a massive data mining tool is implemented.
关 键 词:MapReduce编程模型 数据挖掘 HADOOP平台 模型驱动 可视化
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.144.165.245