检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]曲阜师范大学计算机科学学院,山东日照276826
出 处:《计算机技术与发展》2009年第8期124-126,共3页Computer Technology and Development
基 金:山东省高等学校实验研究项目基金(2005-400);曲阜师范大学校级科研项目(XJ0734)
摘 要:检查点设置与卷回恢复是集群系统中容错计算的重要手段。同步检查点方法在集群系统中得到了广泛应用。为了提高集群计算系统的工作效率,降低系统的容错开销,根据基于消息驱赶的同步检查点设置算法的性质和在实际应用中并行应用程序的通信特征,通过减小协同过程中的阻塞时间,降低系统中控制消息的数量,对基于消息驱赶的Sync-and-Stop算法进行优化。改进的算法有效降低检查点设置的时间和空间开销,减小在系统应用中检查点设置的代价,进一步提高系统可扩展性和应用可靠性。The technology of checkpoint and rollback recovery is an effective method of fault tolerance in cluster system. Synchronous checkpointing method has been widely used in cluster system. For improving the efficiency of cluster computing system, proposes the modified coperative checkpoint to reduce the blocking time and the number of control information, according to nature of algorithm of synchronous checkpointing method and feature of parallel programs. It optimizes the Syne - and - Stop algorithm based on driving information. The test result indicates that this algorithm improves the system's scalability and application's reliability.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13