检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《机械设计与制造工程》2013年第4期28-31,共4页Machine Design and Manufacturing Engineering
摘 要:为了向航空制造业的海量数据处理提供一种新颖的模式,以Hadoop开源软件平台为架构,介绍了HDFS分布式存储系统和Map-Reduce编程模式,分析了航空制造业海量数据处理需求,提出了一种应用于航空制造业的海量数据处理模型,即将数据格式划分为若干个主要字段,按照该数据格式在分片中对数据进行深度优先挖掘,将提取出的数据以键值对的形式并按照一定的存储格式存储于HDFS中,利用Map-Reduce并行算法对存储的数据进行排序和分区处理。最后提出了基于K-NN的并行化数据挖掘算法,且分析了海量数据处理模型的扩展性、实时性和快速处理等性能。In order to provide a new model of mass data processing for aircraft manufacturing industry, it proposes a model of mass data processing for aircraft manufacturing industry based on Hadoop software platform, intro- duces the HDFS and the Map - Reduce programming model, analyzes the demand of mass data processing for aircraft manufacturing industry, introduces a kind of data processing model. This system can divide the data for- mat into several major fields, mine the data from shaming deeply and firstly according to the data format, store the extracted data in HDFS in the format of key - value and the defined storage format, sort and partition the storage data in the method of Map - Reduce. Lastly, it illustrates a parallel data mining algorithm based K - NN, and analyzes the expansibility, instantaneity and quick processing of this kind of mass data processing model.
关 键 词:航空制造业 海量数据 HADOOP 数据处理模型 键值对 算法
分 类 号:TP399[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.141.107.132