面向海量新闻数据的HDFS节能存储策略  被引量:3

Energy Conservation Storage Strategy of HDFS for Massive News Data

在线阅读下载全文

作  者:钟将[1] 杨雷[1] 

机构地区:[1]重庆大学计算机学院,重庆400044

出  处:《计算机工程》2015年第12期48-53,共6页Computer Engineering

基  金:国家"973"计划基金资助项目"高效可信的虚拟计算环境基础研究"(2011CB302600);中央高校基本科研业务费专项基金资助项目(CDJZR185502)

摘  要:基于新闻数据的访问规律,提出一种改进的Hadoop分布式文件系统(HDFS),利用数据节点分区、文件迁移和节点待机等策略,使部分无任务的节点处于待机状态,实现系统高效节能存储。改进传统HDFS的写文件机制,将数据块优先写入剩余空间最大且处于活动状态的节点中,使同一时段内创建的文件尽量分散至不同节点,增加节点待机概率,同时解决集群数据分布不均的问题。实验结果表明,应用节能存储策略的HDFS相比传统HDFS可降耗20%以上,且99.9%的文件读取响应时间均不受影响,具有较好的数据存储与访问性能。Based on the access rules of news data,this paper proposes an improved Hadoop Distributed File System(HDFS).In order to realize system efficiency energy conservation storage,the nodes without tasks are transitioned to standby mode through the data node partition strategy,file migration strategy and node standby strategy.Additionally,to increase the probability of node standby and balance data distribution in the cluster,it improves the traditional HDFS write file strategy.The data block is written in the active node with largest available space,and the files created in the same time period are distributed to different nodes.Experimental result shows the HDFS based on energy conservation storage strategy saves more than20% energy than traditional HDFS,99.9%respones time of reading files are not affected,and it has good data storage and access performance.

关 键 词:文件存储 节能 节点分区 文件迁移 节点匹配 

分 类 号:TP338.8[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象