曙光作业管理系统的可用性评价  被引量:2

Availability Evaluation of Dawning Cluster Job Management System

在线阅读下载全文

作  者:何昱[1,2] 历军[1,3] 聂华[1,3] 

机构地区:[1]中国科学院计算技术研究所 [2]中国科学院研究生院,北京100080 [3]曙光公司,北京100084

出  处:《系统仿真学报》2007年第A01期227-232,共6页Journal of System Simulation

基  金:国家"八六三"高技术研究发展计划基金项目(2002AA104520);北京市政府产业发展基金(2004-082)

摘  要:针对持续发展的高性能计算带来的新需求,我们设计与实现了DCJM机群作业管理系统,并使用了多种高可用保障措施。为了验证其有效性,综合使用可靠性框图、故障树和随机Petri网等工具对DCJM建模,然后基于实际测量的参数,使用统一的模型求解,对系统可用性进行了完整的评价。分析结果显示DCJM系统达到了高可用性。To meet the new requirement of continuous development of HPC Cluster, we design Dawning Cluster Job Management System-DCJM, and implement several layers of high-availability mechanism. To evaluate its availability, we integrate RBDM, Fault Tree and Stochastic Petri Net to build a comprehensive model for DCJM. Then we resolve the model and analyze computation value of the system model. The numerical evaluation result shows that DCJM has achieved a high availability.

关 键 词:作业管理系统 可用性评价 可靠性框图 故障树 随机PETRI网 

分 类 号:TP302[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象