基于高端容错计算机的故障日志分析系统  被引量:3

Fault log analysis system for high-performance fault-tolerant computers

在线阅读下载全文

作  者:魏晨辉[1] 张展[1] 向琳[1] 王书婷[1] 左德承[1] 

机构地区:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001

出  处:《清华大学学报(自然科学版)》2011年第S1期1464-1471,共8页Journal of Tsinghua University(Science and Technology)

基  金:国家"八六三"高技术项目(2008AA01A204;2009AA01A404);国家自然科学基金资助项目(61003047);科技部国际合作计划(2010DFA14400);国家科技支撑计划(2011BAH04B03)

摘  要:高端容错计算机性能评测中,故障库的建立对故障模型、故障传播的研究有着非常重要的意义。该文设计并实现了1个高端容错计算机故障日志分析系统,旨在对日志文件进行故障的抽取和格式化后,构建故障库,并在此基础上运用数据挖掘技术进行关联分析,使系统能够解析尽可能多类型的日志文件。给出了日志分析系统的架构、工作流程及具体实现,并利用该系统对CMU的公共计算机故障集进行统计分析,在其故障库基础上引入极值理论,建立故障分布模型。利用该日志分析系统可建立对高端容错计算机的故障库,从而为相关评测指标的计算、故障模型的建立等提供有效的数据依据。高端容错计算机性能评测中,故障库的建立对故障模型、故障传播的研究有着非常重要的意义。该文设计并实现了1个高端容错计算机故障日志分析系统,旨在对日志文件进行故障的抽取和格式化后,构建故障库,并在此基础上运用数据挖掘技术进行关联分析,使系统能够解析尽可能多类型的日志文件。给出了日志分析系统的架构、工作流程及具体实现,并利用该系统对CMU的公共计算机故障集进行统计分析,在其故障库基础上引入极值理论,建立故障分布模型。利用该日志分析系统可建立对高端容错计算机的故障库,从而为相关评测指标的计算、故障模型的建立等提供有效的数据依据。

关 键 词:故障日志分析 故障库 极值理论 故障模型 

分 类 号:N55[自然科学总论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象