赵捷

作品数:14被引量:47H指数:4
导出分析报告
供职机构:解放军信息工程大学更多>>
发文主题:代码生成自动并行化并行化编译调度MPI更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《小型微型计算机系统》《中国科学:信息科学》《计算机应用》《计算机学报》更多>>
所获基金:国家科技重大专项国家自然科学基金国家高技术研究发展计划国家重点实验室开放基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
面向Stencil计算的自动混合精度优化被引量:3
《软件学报》2023年第12期5704-5723,共20页宋广辉 郭绍忠 赵捷 陶小涵 李飞 许瑾晨 
国家自然科学基金(U20A20226)。
混合精度在深度学习和精度调整与优化方面取得了许多进展,广泛研究表明,面向Stencil计算的混合精度优化也是一个很有挑战性的方向.同时,多面体模型在自动并行化领域取得的一系列研究成果表明,该模型为循环嵌套提供很好的数学抽象,可以...
关键词:自动混合精度 Stencil计算 多面体模型 循环嵌套 调度树 
面向申威异构架构的并行代码自动生成被引量:4
《软件学报》2023年第4期1570-1593,共24页陶小涵 朱雨 庞建民 赵捷 徐金龙 
国家自然科学基金(61702546)。
异构架构逐渐成为高性能计算领域的主流架构,但相较于同构多核架构,其硬件结构及存储层次更为复杂,程序编写更为困难.先进的优化编译器可以协助程序开发人员实现更为高效的代码,降低程序开发复杂度.多面体编译模型通过抽象分析将程序抽...
关键词:申威异构架构 多面体模型 并行计算 代码生成 
基于多面体模型的编译“黑魔法”被引量:13
《软件学报》2018年第8期2371-2396,共26页赵捷 李颖颖 赵荣彩 
国家自然科学基金(61702546)
基于多面体模型的编译技术发展近30年,已经在多个开源编译器和商业编译器中得到了应用和实现.与传统的编译优化模型相比,多面体模型具备应用范围广、表示能力强、优化空间大等优点,代表了程序自动并行化领域众多方向最先进的水平,成为...
关键词:多面体模型 并行性 局部性 依赖 调度 代码生成 循环分块 数组压缩 
基于有向图可达性的SLP向量化识别方法被引量:2
《中国科学:信息科学》2017年第3期310-325,共16页赵捷 赵荣彩 
"核高基"国家科技重大专项(批准号:2009ZX01036-001-001-2);数学工程与先进计算国家重点实验室开放课题(批准号:2013A11)资助项目
SLP(superword level parallelism)是一种实现SIMD(single instruction multiple data)向量化的方法,当前的主流向量化编译器都实现了这种向量化方法.然而,当前算法在进行SLP向量化时,对应用程序中可向量化循环的分析过程过于保守,导致...
关键词:向量化编译器 超字并行 依赖 有向图 可达性 
一个浮点数学函数库测试平台被引量:12
《软件学报》2015年第6期1306-1321,共16页许瑾晨 黄永忠 郭绍忠 周蓓 赵捷 
国家高技术研究发展计划(863)(2009AA012201)
数学函数库作为CPU软件的重要组成部分,对于高性能计算机平台上的科学计算、工程数值计算起着极为关键的作用.现有的测试工具只能片面地对函数库进行测试,没有从正确性、精度和函数性能这3方面加以考虑,而且往往只针对一类目标体系结构...
关键词:数学函数库 测试平台 IEEE-754 精度测试 性能测试 
面向MPI代码生成的Open64编译器后端被引量:5
《计算机学报》2014年第7期1620-1632,共13页赵捷 赵荣彩 韩林 李宝亮 
"核高基"重大专项"支持国产CPU的编译系统及软件工具链"分课题"自动并行化与二进制翻译系统"(2009ZX01036-001-001-2);数学工程与先进计算国家重点实验室开放课题(2013A11)资助~~
随着计算机体系结构的发展,分布式存储结构以其良好的扩展性逐渐占据了高性能计算机体系结构市场的主导地位.为了将现有的串行程序转换为能够在高性能计算机上运行的并行程序,研究人员提出了并行化编译器.然而,当前面向分布存储并行系...
关键词:高性能计算 分布存储 并行化编译系统 Open64编译器 MPI代码 
面向规则DOACROSS循环的流水并行代码自动生成被引量:3
《软件学报》2014年第6期1154-1168,共15页刘晓娴 赵荣彩 赵捷 徐金龙 
"核高基"国家科技重大专项(2009ZX01036-001-001-2)
发掘DOACROSS循环中蕴含的并行性,选择合适的策略将其并行执行,对提升程序的并行性能非常重要.流水并行方式是规则DOACROSS循环并行的重要方式.自动生成性能良好的流水并行代码是一项困难的工作,并行编译器对程序自动并行时常常对DOACR...
关键词:流水并行 自动并行 DOACROSS循环 代价模型 
一种面向划分的数组数据流分析方法
《小型微型计算机系统》2014年第3期532-537,共6页丁锐 赵荣彩 赵捷 
国家"核高基"重大专项子课题项目(2009AA01220;2009zx10036-001-001)资助
传统数组数据流分析方法主要针对精确依赖测试、数组私有化等研究,无法为划分提供数组在循环间详细的定义-引用信息.本文提出了一种面向划分的数组数据流分析方法,通过定义-引用图来表示数组的数据流信息.首先根据嵌套循环的并行性和结...
关键词:数组数据流 划分 自动并行化 分布存储 
面向异构多核处理器的并行代价模型被引量:3
《计算机应用》2013年第6期1544-1547,共4页黄品丰 赵荣彩 姚远 赵捷 
国家"核高基"重大专项(2009ZX01036-001-001-2)
现有的并行代价模型大多是面向共享存储或分布存储结构设计的,不完全适合异构多核处理器。为解决这个问题,提出了面向异构多核处理器的并行代价模型,通过定量刻画计算核心运算能力、存储访问延迟和数据传输开销对循环并行执行时间的影响...
关键词:自动并行化 并行代价模型 异构多核 数据传输开销 加速并行循环 
基于嵌套循环分类的并行识别技术被引量:5
《软件学报》2012年第10期2695-2704,共10页赵捷 赵荣彩 丁锐 黄品丰 
"核高基"国家科技重大专项(2009ZX01036-001-001-2)
传统的分布存储并行编译系统大多是在共享存储并行编译系统的基础上开发的.共享存储并行编译系统的并行识别技术适合OpenMP代码生成,实现方式是将所有嵌套循环都按照相同的识别方法进行处理,用于分布存储并行编译系统必然会导致无法高...
关键词:并行编译 并行识别 嵌套循环 模型法 遍历法 交互法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部