检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈虎[1,2] 周鹏灵 CHEN Hu;ZHOU Pengling(School of Software Engineering,South China University of Technology,Guangzhou Guangdong 510006,China;Guangdong Provincial Key Laboratory of High Performance Computing,Guangzhou Guangdong 510033,China)
机构地区:[1]华南理工大学软件学院,广州510006 [2]广东省高性能计算重点实验室,广州510033
出 处:《计算机应用》2023年第11期3517-3526,共10页journal of Computer Applications
基 金:国家自然科学基金重点项目(U1836207);广东省高性能计算重点实验室开放课题。
摘 要:在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一方面基于消息队列机制开发国产高性能众核处理器的线程级并行机制;另一方面基于单指令多数据流(SIMD)编程模型开发从核上的数据级并行性。首先,对国产高性能众核处理器体系结构进行抽象;其次,设计模型的消息队列机制,并为程序员提供一套异构并行编程接口,如系统参数接口、从核线程控制接口、消息队列接口、SIMD抽象接口;最后,在上述基础上形成全新的高性能计算软件开发模型和方法,方便用户开发基于国产高性能众核处理器的并行计算软件。性能传输测试结果表明,在国产众核处理器上,当启动核数较少时,所提模型的传输带宽普遍达到了峰值直接内存访问(DMA)带宽的90%;当启动的核数较多时,消息队列模型的传输带宽普遍达到了峰值DMA带宽的70%。在矩阵乘法实验中,与系统原语传输矩阵并计算的性能相比,所提模型的性能达到前者的90%;在口令猜测系统中,所提模型的代码性能与直接使用最底层的接口开发的代码性能基本持平。所提通用编程模型和支撑框架使高性能计算(HPC)软件开发更简易,并且具有更好的可移植性,可为促进国产自主HPC软件研发提供帮助。ion interface.Finally,a new software development model and methodology for high-performance computing were formed on the basis of the above,which was convenient for users to develop parallel computing software based on domestic high-performance many-core processors.The results of performance transmission test show that the transmission bandwidth of the proposed model on domestic many-core processors generally reaches 90%of the peak DMA(Direct Memory Access)bandwidth when a few multi-cores are turned on;and that the transmission bandwidth of the message queue model generally reaches 70%of the peak DMA bandwidth when a large number of multi-cores are turned on.In matrix multiplication experiments,the performance of the proposed model reaches 90%of the performance of the system’s original primitives for transferring matrices and calculating them;in password guessing system,the performance of the proposed model code is basically the same as that of the code developed by using the lowest-level interface directly.The proposed generalized programming model and support framework make the High Performance Computing(HPC)software development easier and more portable,which can help to promote the development of domestic independent HPC software.
关 键 词:国产众核处理器 单指令多数据流 并行编程模型 SW26010 消息队列模型
分 类 号:TP311.1[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.221.161.189