检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海理工大学光电信息与计算机工程学院,上海200093
出 处:《计算机工程与设计》2010年第15期3408-3412,共5页Computer Engineering and Design
基 金:国家自然科学基金项目(60573108)
摘 要:为了研究GPU的通用计算能力和适合SMP集群的编程模型,首次提出MPI+CUDA多粒度混合并行编程的新方法,节点间采用MPI实现粗粒度并行,节点内采用CUDA实现细粒度并行的混合编程方式。利用此方法在搭建的3节点SMP集群环境中,测试了大规模矩阵乘问题的并行计算能力。实验结果表明,该方法能够显著提升并行效率,同时证明MPI+CUDA混合编程模型能够充分发挥SMP集群节点间分布式存储和节点内共享内存的优势,为装有CUDA-enabled GPU的SMP集群提供了一种有效的并行策略。In order to study the general computing ability of GPU and programming model suitable for SMP clusters,a method of MPI+ CUDA multi-grain hybrid parallel programming is proposed,which implemented the coarse grain parallel programming between the nodes and the fine grain parallel programming in the node using MPI and CUDA respectively.A SMP clusters environment is built with 3 computers,and the large-scale matrix multiplication with multi-grain hybrid parallel programming is achieved.It is indicated that MPI+ CUDA hybrid parallel programming is an effective parallel strategy for the parallel computing in the SMP clusters with CUDA-enabled GPU,which exerts the advantages of the share memory in the node and the distributional memory between the nodes in the SMP clusters.This method promote parallel efficiency remarkably.
关 键 词:消息传递接口 统一计算设备架构 集群 混合编程 支持CUDA的GPU
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.221.242.128