对称矩阵三对角化的混合并行算法设计  被引量:3

Design of Hybrid Parallel Algorithm for Tridiagonalizing Symmetric Matrix

在线阅读下载全文

作  者:赵永华[1] 迟学斌[1] 陈江[1] 

机构地区:[1]中国科学院计算机网络信息中心超级计算中心

出  处:《计算机工程》2005年第22期39-41,53,共4页Computer Engineering

基  金:国家"863"超级计算网格节点建设基金资助项目(2002AA104540);中国科学院知识创新工程信息化建设专项基金资助项目(INF05-SCE)

摘  要:基于Householder转换,给出了稠密对称矩阵三对角化的MPI+OpenMP混合并行算法。内容集中在SMP集群系统环境下算法的负载平衡、通信开销和性能评价。OpenMP共享内存并行采用了粗粒度方法,解决了MPI算法中的负载平衡问题,降低了通信开销。在深腾6800上的试验结果表明,MPI+OpenMP版本比纯MPI版本具有更好的性能和可扩展性。Based on Householder transformation, MPI+OpenMP hybrid parallel algorithm of tridiagonalizing a dense symmetric matrix is presented. This paper focuses on load balancing, communication overhead and performance evaluation on cluster of SMP's environments. An OpenMP shared memory parallel approach is coarse grain, this overcomes the load imbalance problem, reduces communication overhead. An experimental analysis on the Deepcomp6800 shows the hybrid MPI+OpenMP algorithm has better performance and scalability than pure MPI algorithm.

关 键 词:对称矩阵 并行块算法 三对角矩阵 加速比 MPI+OPENMP 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象