检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李雁冰[1,2] 赵荣彩[1,2] 丁锐[1,2] 赵博[1,2]
机构地区:[1]信息工程大学,河南郑州450001 [2]数学工程与先进计算国家重点实验室,河南郑州450001
出 处:《信息工程大学学报》2015年第1期98-106,共9页Journal of Information Engineering University
基 金:国家科技重大专项资助项目(2009ZX01036-001-001-2);国家重点实验室开放课题资助项目(2013A11)
摘 要:由于异构多核处理器中加速设备内存有限,在进行加速计算时往往需要把主存中的数据分块传输到设备内存。Open ACC现有的数据拷贝子句不支持数据的分块传输,为此对Open ACC的数据拷贝子句进行扩展,引入分块规则数组区域表示方式,用于实现数据的分块交叉传输。分块交叉传输能够使加速器所需数据精确地拷贝到其设备内存,提高了设备内存的利用率和减少了不必要的数据传输。并在基于Open64的"源-源"自动并行化系统autoACC中,实现了扩展数据拷贝子句的自动生成。测试结果表明,在异构多核处理器上,扩展的数据拷贝子句及提出的扩展数据拷贝子句生成方法是有效的,能够对程序进行有效加速。On account of the limit of accelerator device memory in heterogeneous multi-core processors,the data in the host memory needs to be transmitted to the device memory with the form of data block. Since the current data copy clauses of Open ACC do not support the blocking data transmission,an extension is introduced by adopting blocking regular array region representations. The data can be copied to the device memory accurately through cross-block data transmission. As a result,the utilization rate of the device memory increases,and the rate of useless data transformation declines. The automatic generation of extended data copy clauses is implemented in the source-tosource auto-parallelization system,"auto-ACC"based on Open64. The experimental results show that the extended data copy clauses and its automatic generation mothed is effective in heterogeneous multi-core processors.
关 键 词:异构多核处理器 Open ACC 分块交叉数据传输 分块规则数组区域 自动并行化
分 类 号:TP314[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.46