基于Hadoop的PB级海量数据处理系统的设计与实现  被引量:8

Design and Implementation of Petabyte Data Processing System based on Hadoop

在线阅读下载全文

作  者:简玲[1] 

机构地区:[1]上海市公安局网络安全保卫总队,上海200025

出  处:《信息网络安全》2013年第11期87-89,共3页Netinfo Security

摘  要:随着互联网的普及,PB级海量数据的存储、处理需求越来越大,传统数据库和存储架构已不能满足如此大数据量下的快速响应需求。作为一个开源的分布式系统基础架构,Hadoop提供了高可靠性的分布式存储架构和高速的海量数据计算方式,被视为解决海量数据处理瓶颈的有效途径。文章通过搭建Hadoop集群平台对1PB海量数据进行存储、处理,大大提高了系统处理性能。With the popularization of internet, the needs of petabyte-scale data storage and processing are bigger and bigger, traditional database and storage structure couldn't meet the quick response based on so large amount of data, As a open source distributed system structure, Hadoop gives high-reliability distributed storage structure and high-speed mass data computing methods, is considered a effective way to resolve the bottleneck of mass data processing. In this paper, we build a hadoop platform to store and process a petabyte data, and the system performance is improved greatly.

关 键 词:HADOOP PB级 海量数据处理 分布式存储 

分 类 号:TP274[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象