检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:寇大治[1]
机构地区:[1]上海超级计算中心,上海201203
出 处:《科研信息化技术与应用》2013年第4期76-81,共6页E-science Technology & Application
基 金:上海市科学技术委员会资助项目(1201H116400);国家高技术研究发展计划(863计划)(2012AA01A308)
摘 要:本文针对高性能计算机系统在启动/重新启动之后的可用性和健康度的检测方面提出了一套检测标准,这一标准流程自系统启动/重新启动开始,至系统所提供的相关高性能计算应用服务完备为止,包括一系列标准行为以及相应的检测模块。据此设计实现了一套针对曙光5000A超级计算机的检测系统并取得了良好的效果。To ensure that the HPC system is in normal operation and well functioning after system initialization, we proposed a method to monitor the performance of HPC system in this paper. The monitoring system contains several testing modules, the monitoring process started at the beginning of the HPC system initialization, and ends before notifying users that they can login and submit their jobs. Based on the proposed method, we designed and implemented a monitoring system for Dawning 5000A supercomputer, and achieved good testing results.
分 类 号:TP338.4[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15