面向异构多核处理器的的循环分块  被引量:4

Loop tiling for heterogeneous multi-core processor

在线阅读下载全文

作  者:李雁冰[1,2] 赵荣彩[1,2] 赵博[1,2] 黄品丰[1,2] 

机构地区:[1]信息工程大学,河南郑州450001 [2]数学工程与先进计算国家重点实验室,河南郑州450001

出  处:《计算机工程与设计》2015年第1期168-173,共6页Computer Engineering and Design

基  金:"核高基"国家科技重大专项基金项目(2009ZX01036-001-001-2);数学工程与先进计算国家重点实验室开放课题基金项目(2013A11)

摘  要:将OpenACC编程模型用于异构多核处理器时,由于异构多核处理器加速设备内存有限,操作大量数据的代码不能获得很好的加速。针对这一问题,在OpenACC中引入循环分块子句,对循环进行分块处理,使每个循环块使用的数据能够存储在设备内存中;提出面向异构多核处理器的循环分块子句生成算法,并在基于Open64的"源-源"自动并行化系统Auto-ACC中进行实现。测试结果表明,在异构多核处理器上,扩展的循环分块子句及所提生成算法能够对程序进行明显的加速。When using the OpenACC programming model in the heterogeneous multi-core processor, fine accelerated perfor mance can not be achieved because of the limited device memory. To solve this problem, the block clause was introduced, which stored data of each loop block in the device memory by implementing loop tiling. Then a generating algorithm orienting the hete- rogeneous multi-core processor was presented, which was verified in the source to source auto-parallelization system Auto-ACC based on Open64. The experimental results show that distinct speedup can he achieved with the extended loop block clause and the corresponding algorithm in the heterogeneous multi-core processor.

关 键 词:异构多核处理器 循环分块 数据重用 OpenACC 自动并行化 

分 类 号:TP314[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象