容错并行算法的性能分析  被引量:2

Performance Evaluation for Fault-tolerant Parallel Algorithm

在线阅读下载全文

作  者:杜云飞[1] 唐玉华[1] 杨学军[1] 

机构地区:[1]国防科技大学计算机学院并行与分布处理国家重点实验室,长沙410073

出  处:《计算机科学》2009年第9期248-251,共4页Computer Science

基  金:国家自然科学基金项目(60621003;60633050和60873014);国家863项目(2008AA01Z110)资助

摘  要:容错并行算法是一种应用级容错方法,它通过并行复算的方法实现快速的故障恢复。容错并行算法是在并行算法设计的基础上增加了容错设计部分,因此其性能评估必须考虑故障对程序性能的影响。研究了评估故障情况下容错并行算法性能的各种度量,建立了性能模型预测容错并行算法的期望执行时间,以此为基础评估了程序段的运行时间、数据保存开销、故障率以及并行复算加速比等系统参数对容错并行算法性能的影响。The fault-tolerant parallel algorithm (FTPA) is an application-level technique for tolerating hardware failures. FTPA achieves fast failure recovery making use of parallel recomputing. How to deal with system failures is a contern in the design of FTPA. Thus,evaluating the performance of FTPA under system failures is necessary. In this study, we presented the performance metrics to evaluate the performance of FTPA and a model to predict the application completion time under system failures. Then, the influence of program section executing time, checkpointing cost, failure rate,and speedup of parallel recomputing on the performance of FTPA were evaluated.

关 键 词:容错并行算法 执行时间 加速比 效率 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构] U463.212[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象