利用冗余进程实现MPI程序错误检测  被引量:2

Error Detection by Redundant Processes for MPI Programs

在线阅读下载全文

作  者:富弘毅[1] 宋伟[1] 杨学军[1] 

机构地区:[1]国防科技大学计算机学院并行与分布计算国家重点实验室,湖南长沙410073

出  处:《微电子学与计算机》2009年第9期53-56,共4页Microelectronics & Computer

基  金:国家自然科学基金项目(60621003;60633050)

摘  要:关注MPI并行程序的运行时错误检测,提出了一种基于冗余进程的检错方法REDReP,能够检测MPI并行程序在运行过程中由于硬件故障导致的数据错误.介绍了REDReP的基本思想,讨论了一些关键问题,最后给出了实验结果,表明REDReP具有较低的检错开销.This paper works on runtime error detection for MPI programs and proposes a novel error detection approach, making use of redundant processes, called REDReP. The paper first introduces the basic idea of REDReP, then discusses some key problems, and finally presents the experimental evaluation. REDReP can achieve minor overhead.

关 键 词:错误检测 冗余 MPI 容错技术 

分 类 号:TP302.8[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象