面向异构多核处理器的分块交叉数据传输  被引量:1

Cross-Block Data Transmission for Heterogeneous Multi-Core Processors

在线阅读下载全文

作  者:李雁冰[1,2] 赵荣彩[1,2] 丁锐[1,2] 赵博[1,2] 

机构地区:[1]信息工程大学,河南郑州450001 [2]数学工程与先进计算国家重点实验室,河南郑州450001

出  处:《信息工程大学学报》2015年第1期98-106,共9页Journal of Information Engineering University

基  金:国家科技重大专项资助项目(2009ZX01036-001-001-2);国家重点实验室开放课题资助项目(2013A11)

摘  要:由于异构多核处理器中加速设备内存有限,在进行加速计算时往往需要把主存中的数据分块传输到设备内存。Open ACC现有的数据拷贝子句不支持数据的分块传输,为此对Open ACC的数据拷贝子句进行扩展,引入分块规则数组区域表示方式,用于实现数据的分块交叉传输。分块交叉传输能够使加速器所需数据精确地拷贝到其设备内存,提高了设备内存的利用率和减少了不必要的数据传输。并在基于Open64的"源-源"自动并行化系统autoACC中,实现了扩展数据拷贝子句的自动生成。测试结果表明,在异构多核处理器上,扩展的数据拷贝子句及提出的扩展数据拷贝子句生成方法是有效的,能够对程序进行有效加速。On account of the limit of accelerator device memory in heterogeneous multi-core processors,the data in the host memory needs to be transmitted to the device memory with the form of data block. Since the current data copy clauses of Open ACC do not support the blocking data transmission,an extension is introduced by adopting blocking regular array region representations. The data can be copied to the device memory accurately through cross-block data transmission. As a result,the utilization rate of the device memory increases,and the rate of useless data transformation declines. The automatic generation of extended data copy clauses is implemented in the source-tosource auto-parallelization system,"auto-ACC"based on Open64. The experimental results show that the extended data copy clauses and its automatic generation mothed is effective in heterogeneous multi-core processors.

关 键 词:异构多核处理器 Open ACC 分块交叉数据传输 分块规则数组区域 自动并行化 

分 类 号:TP314[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象