-

检索结果分析

结果分析中...
检索条件:"关键词=OpenACC "
条 记 录,以下是1-10
视图:
排序:
显示条数:
基于神威众核处理器的排列熵算法并行加速方法被引量:2
《计算机应用研究》2020年第7期2022-2026,共5页张浩 花嵘 于建志 梁建国 冯鲁彬 
国家重点研发计划项目子课题(2017YFB0202002);山东省自然科学基金资助项目(ZR2018BF001)。
随着嵌入维数的增大,排列熵(permutation entropy,PE)算法的运算规模将会成倍增加,对计算的时效性提出了更高的要求。针对国际上首台计算性能超过100P的神威·太湖之光异构众核超级计算机,提出一种针对排列熵算法移植和并行化方法,核组...
关键词:排列熵 神威众核处理器 MPI OpenACC 嵌入维数 
Acceleration of Lattice Boltzmann Simulation via OpenACC
《Journal of Harbin Institute of Technology(New Series)》2018年第5期44-52,共9页Shuhao Guo Jie Wu 
Sponsored by the Research Fund of State Key Laboratory of Mechanics and Control of Mechanical Structures(Nanjing University of Aeronautics and Astronautics)(Grant No.MCMS-0117G01)
The parallel acceleration of well-developed serial codes for numerical simulations of fluid dynamic problems is implemented in this paper. To solve the flow field,the lattice Boltzmann method( LBM) is used. The OpenAC...
关键词:OpenACC LATTICE BOLTZMANN SIMULATION parallel COMPUTING 
MATLAB与OpenACC结合实现中值滤波算法并行优化
《河北工程大学学报(自然科学版)》2019年第2期101-104,共4页黄伟建 王月兴 黄远 
河北省自然科学基金资助项目(F2015402077);河北高等学校科学技术研究项目(QN2018073)
针对当前基于CUDA的中值滤波并行加速算法存在的编程复杂,图像数据提取和显示环节实现繁琐等问题提出了利用MATLAB和OpenACC结合的并行算法。该算法采用MATLAB实现图像的提取并转换成数组文件,之后利用OpenACC实现串行代码到并行代码的...
关键词:OpenACC MATLAB 中值滤波 GPU并行优化 
在Intel Knights Corner和NVIDIA Kepler架构上OpenACC的性能可移植性分析被引量:1
《计算机科学》2015年第1期75-78,共4页王一超 秦强 施忠伟 林新华 
OpenACC是一套基于指导语句方式的并行编程语言标准。编程者可以通过在代码中添加符合该标准的指导语句,经OpenACC编译器的编译,将串行代码并行化地移植到加速器或者协处理器上,进而获得异构加速器所带来的加速效果。OpenACC与CUDA和Ope...
关键词:OpenACC 性能可移植性 高性能计算 
一种基于OpenACC指令加速的素数生成算法
《信息与电脑》2016年第20期97-98,共2页杨帅 
当前,微机系统大多使用GPGPU设备加速计算,但是使用底层API进行并行加速效率不高且计算繁琐,使用基于指令的更高级抽象编程可解决这个问题。Open ACC就是为解决CUDA、Open CL等底层API开发的复杂性而开发出来的。笔者针对一种素数生成算...
关键词:OpenACC CUDA GPU 素数 
基于GPU加速的投影后变分壳模型计算
《原子能科学技术》2024年第2期272-278,共7页陆晓 连占江 高早春 
国家自然科学基金(11975314,11575290);核数据重点实验室开放基金(JCKY2022201C158);国家财政部稳定支持研究经费(WDJC-2019-13,BJ20002501)。
为进一步拓展投影后变分(VAP)壳模型计算应用核区范围,需提升VAP的计算效率。为此,利用OpenACC并行编程指令,首次将VAP程序从传统的CPU平台移植到了高性能GPU计算平台上。在角动量投影的每个积分格点上实现了数目庞大的各独立转动矩阵元...
关键词:壳模型 投影后变分 GPU OpenACC 
基于国产十亿亿次超算系统的近连续过渡流区N-S/DSMC耦合算法并行优化研究被引量:2
《计算机工程与科学》2019年第4期583-589,共7页徐金秀 李中华 孙俊 李志辉 郑岩 
国家973计划(2014CB744100);国家重点研发计划(2017YFB0202702);国家自然科学基金(91530319)
过渡流区气动问题的数值模拟一直是空气动力学领域的难点。首先介绍了在已有N-S解算器和DSMC方法研究基础上,采用MPC耦合技术建立N-S/DSMC耦合算法,把DSMC方法和N-S方法的应用范围拓展到近连续过渡流区。然后详述了基于国家超级计算无...
关键词:高超声速过渡流 模块化的颗粒-连续模拟技术 耦合算法 OpenACC 
BCC_AGCM大气环流模式异构众核加速技术被引量:3
《气象科技》2018年第2期245-249,417,共6页肖洒 魏敏 
公益性行业专项(气象)科研专项(GYHY201306062);国家重点研发计划项目(2016YFA0602102);中国气象局局校合作项目"气象模式众核平台移植开发"共同资助
针对未来高性能计算在CPU混合架构上的发展趋势,本文对大气环流模式BCC_AGCM中的部分核心段在混合架构的神威·太湖之光高性能计算机系统上进行众核加速分析与优化。文中以核心段quad为例,通过对代码内容结构重写和使用OpenACC语言对程...
关键词:混合架构 神威·太湖之光 BCC_AGCM OpenACC 
一种基于OPENACC的GPU加速实现高斯模糊算法被引量:7
《计算机技术与发展》2013年第7期147-150,共4页曾文权 胡玉贵 何拥军 林敏 
广东省自然科学基金(S2011010002537);广东省科技计划项目(2012A030400029)
针对使用底层API进行GPU加速时存在的编码复杂以及效率低下等缺陷,文中试图利用基于中间层的OPENACC加速技术对传统的串行代码进行改写,从而达到改善开发效率,简化代码之目的。文中以传统的串行高斯模糊算法为处理对象,在其中添加OPENAC...
关键词:OPENACC 图形处理器 统一计算架构 高斯模糊 
一种基于国产异构众核处理器的C++智能源码转换框架被引量:3
《计算机工程与科学》2021年第6期997-1005,共9页俞茂学 贾东宁 魏志强 许佳立 马广浩 
山东省重大科研平台建设项目(2018SDPT01)。
国产异构众核处理器是我国打破国际技术壁垒,在高性能计算领域取得突破的关键环节。围绕国产超算的软件生态环境建设,采用智能源码转换的方法盘活海量多核架构的遗产代码是加速软件研发效率,推动领域发展的重要途径。针对国产运算核心...
关键词:异构众核 源码转换 OpenACC 并行计算 ANTLR C++ 
检索报告 对象比较 聚类工具 使用帮助 返回顶部