检查点系统中进程地址空间的优化存储策略  

Optimization Strategies of Process Address Space Storage in Checkpoint System

在线阅读下载全文

作  者:李艳红[1] 孟丹[1] 周应超[1] 武林平[1] 

机构地区:[1]中国科学院计算技术研究所,北京100080

出  处:《计算机工程与应用》2005年第29期94-96,113,共4页Computer Engineering and Applications

基  金:国家863高技术研究发展计划重大专项:面向网格的高性能计算机--曙光4000(编号:2002AA104410);国家863计划软件重大专项:集群服务器功能软件(编号:2002AA1Z2102)

摘  要:机群系统的规模增大,部件增多,导致了机群的组合错误率也不断上升。节点失效使运行于机群节点上的作业面临中途失败,从而造成巨大的资源浪费,甚至导致大量的作业无法完成。检查点系统为节点提供了较好的容错性能,因此成为机群操作系统软件的重要组成部分。进程的地址空间是检查点系统需要记录的一部分重要内容,对它的存储效率直接影响检查点操作的性能。论文提出了两种检查点系统中进程地址空间的优化存储策略。其中组合式检查点文件写策略解决了并发写机制在应用内存接近物理内存时的性能突降问题,A-O(Access-Order)进程地址空间存储策略调整传统地址空间的存储顺序,使大内存应用的检查点操作性能得到了大幅度提升。在实验中,A-O进程地址空间存储策略最高可以将传统的存储策略的时间开销缩减至原来的50%。With the increment of the scale of cluster,the combined fault probability increases.Node failure makes task interrupted possible when it is running on the cluster,so induces huge waste of resources and even prevents the task completing finally.Checkpoint System provides good fault tolerance for computing nodes and becomes important cluster operating system software.The strategies of process address space storage play key role in checkpoint system,and two optimization strategies are given in this paper.Combined written strategy resolves the performance drop problem and A-O storage strategy improves the time performance of checkpoint system.Experimental results indicate that A-O strategy can reduce checkpoint time overhead to 50% in the best case.

关 键 词:机群系统 节点失效 检查点系统 存储策略 

分 类 号:TP302[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象