检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李艳红[1] 孟丹[1] 周应超[1] 武林平[1]
出 处:《计算机工程与应用》2005年第29期94-96,113,共4页Computer Engineering and Applications
基 金:国家863高技术研究发展计划重大专项:面向网格的高性能计算机--曙光4000(编号:2002AA104410);国家863计划软件重大专项:集群服务器功能软件(编号:2002AA1Z2102)
摘 要:机群系统的规模增大,部件增多,导致了机群的组合错误率也不断上升。节点失效使运行于机群节点上的作业面临中途失败,从而造成巨大的资源浪费,甚至导致大量的作业无法完成。检查点系统为节点提供了较好的容错性能,因此成为机群操作系统软件的重要组成部分。进程的地址空间是检查点系统需要记录的一部分重要内容,对它的存储效率直接影响检查点操作的性能。论文提出了两种检查点系统中进程地址空间的优化存储策略。其中组合式检查点文件写策略解决了并发写机制在应用内存接近物理内存时的性能突降问题,A-O(Access-Order)进程地址空间存储策略调整传统地址空间的存储顺序,使大内存应用的检查点操作性能得到了大幅度提升。在实验中,A-O进程地址空间存储策略最高可以将传统的存储策略的时间开销缩减至原来的50%。With the increment of the scale of cluster,the combined fault probability increases.Node failure makes task interrupted possible when it is running on the cluster,so induces huge waste of resources and even prevents the task completing finally.Checkpoint System provides good fault tolerance for computing nodes and becomes important cluster operating system software.The strategies of process address space storage play key role in checkpoint system,and two optimization strategies are given in this paper.Combined written strategy resolves the performance drop problem and A-O storage strategy improves the time performance of checkpoint system.Experimental results indicate that A-O strategy can reduce checkpoint time overhead to 50% in the best case.
分 类 号:TP302[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.225.234.109