基于调度树的分布式文件系统数据流调度算法研究  

Research on data stream scheduling algorithm of distributed file system based on scheduling tree

在线阅读下载全文

作  者:高原[1,2,3] 顾文杰[1,2,3] 彭晖 陈鹏[1,2,3] 季学纯 Gao Yuan Gu Wenjie PengHui Chen Peng Ji Xuechun(NARI Group Corporation/State Grid Electric Power Research Institute, Nanjing 211106, China NARI Technology Development Co., Ltd., Nanjing 211106, China State Key Laboratory of Smart Grid Protection and Control, Nanjing 211106, China)

机构地区:[1]南瑞集团公司(国网电力科学研究院),江苏南京211106 [2]国电南瑞科技股份有限公司,江苏南京211106 [3]智能电网保护和运行控制国家重点实验室,江苏南京211106

出  处:《江苏科技信息》2017年第27期40-42,45,共4页Jiangsu Science and Technology Information

摘  要:文章针对HDFS的数据写入性能不高的问题提出了一种基于调度树的数据流并发传输的调度算法。该算法将文件系统的节点分为转发节点和叶子节点,按流量匹配原则将节点编排为调度树后进行副本分发,让所有节点的网卡并发传输,磁盘并发写入,减小了副本写入分布式文件系统的时间。性能测试表明,使用该算法的分布式文件系统的写入性能较原始的HDFS更高。This article proposes a scheduling algorithm for concurrent transmission of data flow based on scheduling tree with an aim to improve the performance of HDFS.The algorithm divides the nodes of the file system into forwarding nodes and leaf nodes,distributes the duplicates by arranging the nodes into the scheduling tree according to the principle of information flow matching,and realize the concurrent transmission of adapters and the concurrent disk input which shortens the time used for writing the duplicates into the distributed files.The performance tests shows that the distributed file system of this algorithm is better than the original HDFS with regard to disk input.

关 键 词:分布式文件系统 数据流 并发 调度 

分 类 号:TP316[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象