丁锐

作品数:15被引量:48H指数:3
导出分析报告
供职机构:解放军信息工程大学更多>>
发文主题:自动并行化并行化编译通信代码生成数据分布更多>>
发文领域:自动化与计算机技术电子电信更多>>
发文期刊:《小型微型计算机系统》《软件学报》《计算机工程》《计算机应用》更多>>
所获基金:国家科技重大专项国家高技术研究发展计划国家重点实验室开放基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
SIMD自动向量化编译优化概述被引量:31
《软件学报》2015年第6期1265-1284,共20页高伟 赵荣彩 韩林 庞建民 丁锐 
"核高基"国家科技重大专项(2009ZX01036-001-001-2)
SIMD扩展部件是集成到通用处理器中的加速部件,旨在发掘多媒体程序和科学计算程序的数据级并行.首先介绍SIMD扩展部件的背景和研究现状,然后从发掘方法、数据布局、多平台向量化这3个角度介绍了SIMD自动向量化的研究问题、困难和最新研...
关键词:SIMD扩展部件 自动向量化 数据级并行 编译优化 
面向异构多核处理器的分块交叉数据传输被引量:1
《信息工程大学学报》2015年第1期98-106,共9页李雁冰 赵荣彩 丁锐 赵博 
国家科技重大专项资助项目(2009ZX01036-001-001-2);国家重点实验室开放课题资助项目(2013A11)
由于异构多核处理器中加速设备内存有限,在进行加速计算时往往需要把主存中的数据分块传输到设备内存。Open ACC现有的数据拷贝子句不支持数据的分块传输,为此对Open ACC的数据拷贝子句进行扩展,引入分块规则数组区域表示方式,用于实现...
关键词:异构多核处理器 Open ACC 分块交叉数据传输 分块规则数组区域 自动并行化 
面向循环的混合向量化方法研究被引量:4
《小型微型计算机系统》2014年第12期2764-2769,共6页徐金龙 赵荣彩 丁锐 
国家"八六三"高技术研究发展计划项目(2009AA01220)资助;国家"核高基"重大专项项目(2009zx10036-001-001)资助
目前主流的两种向量化算法基于循环(loop-based)的向量化算法和超字并行(SLP)算法分别适用于不同特征的循环,前者适用于发掘迭代间的并行,后者擅于发掘迭代内的并行.向量化算法的选择将直接影响最终的向量化效果.为了增强向量化能力,提...
关键词:基于循环 超字并行 迭代间 迭代内 依赖 
自动并行化中不规则循环的通信代码生成
《计算机应用》2014年第4期1014-1018,共5页傅立国 姚远 丁锐 
"核高基"国家科技重大专项(2009ZX01036-001-001-2)
不规则计算在大规模并行应用中广泛存在。在面向分布存储结构的自动并行化过程中,较难在编译时为不规则循环生成并行代码。并行代码中的通信代码对程序运行结果的正确性以及加速效果有着严重的影响。通过分析程序的数组重分布图,使用部...
关键词:自动并行化 不规则循环 不规则数组 计算分解 部分冗余 
一种面向划分的数组数据流分析方法
《小型微型计算机系统》2014年第3期532-537,共6页丁锐 赵荣彩 赵捷 
国家"核高基"重大专项子课题项目(2009AA01220;2009zx10036-001-001)资助
传统数组数据流分析方法主要针对精确依赖测试、数组私有化等研究,无法为划分提供数组在循环间详细的定义-引用信息.本文提出了一种面向划分的数组数据流分析方法,通过定义-引用图来表示数组的数据流信息.首先根据嵌套循环的并行性和结...
关键词:数组数据流 划分 自动并行化 分布存储 
一种基于数组生命期的数据分解算法
《软件学报》2013年第12期2843-2858,共16页丁锐 赵荣彩 韩林 
国家高技术研究发展计划(863)(2009AA01220);"核高基"重大专项(2009zx10036-001-001)
划分是一种自动分配计算和数据到各个处理器的编译技术,是分布存储结构下并行编译的核心问题.以往的划分研究较少从生命期的角度考虑数据分解问题,分解在数组的不同生命期中不一致时会产生冗余通信.为解决上述问题,提出了一种数据分解算...
关键词:数据分解 数组生命期 自动并行化 分布存储 
面向DSWP并行的OpenMP任务调度机制的扩展与实现被引量:2
《计算机科学》2013年第9期38-43,共6页刘晓娴 赵荣彩 丁锐 
国家"核高基"重大专项(2009ZX01036-001-001-2)资助
多核处理器能够提升多线程程序的性能,但早已存在的诸多单线程程序无法从中获益,程序员也习惯于编写单线程程序。自动并行化技术是将单线程程序移植到多核上的重要手段,但是当循环中存在无法确定的数据依赖或复杂的控制流时,传统的自动...
关键词:自动并行化 OPENMP DSWP 任务调度机制 GCC 
基于循环分块的流水粒度优化算法被引量:1
《计算机应用》2013年第8期2171-2176,共6页刘晓娴 赵荣彩 丁锐 李雁冰 
"核高基"国家科技重大专项(2009ZX01036-001-001-2)
当计算划分层迭代数目较大,或是循环体单次迭代工作量较大,但可用的并行线程数目较小时,传统的基于循环分块的流水粒度优化方法无法进行处理。为此,提出一种基于循环分块减小流水粒度的方法,并根据流水并行循环的代价模型实现最优流水...
关键词:自动并行化 流水并行 流水粒度 循环分块 代价模型 
自动并行化中不规则问题的划分方法被引量:1
《信息工程大学学报》2013年第2期235-242,共8页丁锐 赵荣彩 刘晓娴 傅立国 
国家863计划资助项目(2009AA01120;2009ZX10036-001-001)
许多大规模计算程序包含了不规则问题。在面向分布存储的自动并行化中,以往的研究在编译时划分不规则问题的循环和数组较难。文章提出了一种划分方法自动为一类常见的不规则问题寻找计算和数据分解,能在编译时通过计算分解分配不规则数...
关键词:自动并行化 计算分解 不规则循环 不规则数组 
基于嵌套循环分类的并行识别技术被引量:5
《软件学报》2012年第10期2695-2704,共10页赵捷 赵荣彩 丁锐 黄品丰 
"核高基"国家科技重大专项(2009ZX01036-001-001-2)
传统的分布存储并行编译系统大多是在共享存储并行编译系统的基础上开发的.共享存储并行编译系统的并行识别技术适合OpenMP代码生成,实现方式是将所有嵌套循环都按照相同的识别方法进行处理,用于分布存储并行编译系统必然会导致无法高...
关键词:并行编译 并行识别 嵌套循环 模型法 遍历法 交互法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部