Hadoop中处理海量小文件的方法  被引量:1

Methods of Dealing With Massive Small Files in Hadoop

在线阅读下载全文

作  者:李旭[1] 李长云[1] 张清清[1] 胡淑新 周玲芳[1] 

机构地区:[1]湖南工业大学计算机与通信学院,株洲412007

出  处:《计算机系统应用》2015年第11期157-161,共5页Computer Systems & Applications

基  金:2013年度科技部科技支撑计划(2013BAJ10B14-5)

摘  要:针对Hadoop中提供底层存储的HDFS对处理海量小文件效率低下、严重影响性能的问题.设计了一种小文件合并、索引和提取方案,并与原始的HDFS以及HAR文件归档方案进行对比,通过一系列实验表明,本文的方案能有效减少Namenode内存占用,提高HDFS的I/O性能.HDFS provides the underlying storage for Hadoop, however, the HDFS deals with massive small files inefficiently and decreases system performance seriously. To solve this problem, we designed a file merging, indexing and retrieval solution. Then through a series of experiments compared to the original HDFS and HAR solution, it can be shown that our scheme can effectively reduce the memory usage of Namenode and improve the I / O performance of HDFS.

关 键 词:HADOOP HDFS 小文件 HDFS的I/O性能 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象