一种基于扩展数据流分析的OpenMP程序应用级检查点机制  被引量:7

An Application-Level Checkpointing Based on Extended Data Flow Analysis for OpenMP Programs

在线阅读下载全文

作  者:富弘毅[1,2] 丁滟[1,2] 宋伟[1,2] 杨学军[1,2] 

机构地区:[1]国防科学技术大学并行与分布处理国家重点实验室,长沙410073 [2]国防科学技术大学计算机学院,长沙410073

出  处:《计算机学报》2010年第10期1809-1822,共14页Chinese Journal of Computers

基  金:国家自然科学基金(60921062;61003087);国家"八六三"高技术研究发展计划项目基金(2009AA01Z102)资助;support by the National Natural Science Foundation of China;with the project #60621003

摘  要:随着多核处理器体系结构在高性能计算领域日益广泛的应用,面向共享存储并行程序的容错问题成为研究的热点.近年来,检查点技术已经成为该领域占主导地位的容错机制.目前已有一些针对OpenMP程序检查点技术的研究工作,但其中绝大多数解决方案都依赖于特殊的运行时库或硬件平台.该文提出一种编译辅助的OpenMP应用级检查点,它是一种平台无关的方案,通过面向OpenMP的扩展数据流分析选择那些"必需"的变量保存到检查点映像,从而降低容错的开销,同时通过运行一种非阻塞式的协议维护检查点的全局一致性.文章讨论了该机制的各个关键问题,并通过实验评测以及与同类工作的比较,表明了该文所提出的检查点机制在容错性能方面的优势.formance research. Recently, posed. H paper proposes a compiler-assisted application level cheekpointing for OpenMP programs. It is a platform-independent scheme, and through the extended static data flow analysis, it automatical- ly chooses those 'must-be-saved' variables to save in the checkpoint image, to reduce the over- head. It also maintains the global coherence of checkpoints by running a non-block protocol. In this paper, the key issues in the approach are discussed in detail, and the experimental result and the comparison with similar works show the proposed approach achieves promising performance.

关 键 词:容错 共享存储 OPENMP 应用级检查点 数据流分析 

分 类 号:TP302[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象