“核心电子器件、高端通用芯片及基础软件产品”国家科技重大专项(2009ZX01036-001-001-2)

作品数:31被引量:67H指数:4
导出分析报告
相关作者:赵荣彩丁锐赵捷姚远韩林更多>>
相关机构:解放军信息工程大学中国人民解放军信息工程大学国防科学技术大学更多>>
相关期刊:《计算机应用研究》《中国科学:信息科学》《计算机应用》《计算机工程与设计》更多>>
相关主题:自动并行化向量化SIMDSLP自动向量化更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
依赖距离主导的向量化方法研究
《计算机应用研究》2017年第5期1311-1315,共5页丁丽丽 韩林 王冬 张素平 王鹏翔 于海宁 
"核高基"国家科技重大专项资助项目(2009ZX01036-001-001-2)
向量寄存器的非满载使用方式为大量迭代次数不足的循环提供了向量化的机会,但也导致向量化的并行宽度不固定,传统的向量因子主导的依赖测试方法不再适用。提出了一种依赖距离主导的依赖测试方法,通过分析依赖图中所有依赖环的破环关键...
关键词:依赖测试 依赖距离 向量因子 并行宽度 向量化 向量寄存器 
基于有向图可达性的SLP向量化识别方法被引量:2
《中国科学:信息科学》2017年第3期310-325,共16页赵捷 赵荣彩 
"核高基"国家科技重大专项(批准号:2009ZX01036-001-001-2);数学工程与先进计算国家重点实验室开放课题(批准号:2013A11)资助项目
SLP(superword level parallelism)是一种实现SIMD(single instruction multiple data)向量化的方法,当前的主流向量化编译器都实现了这种向量化方法.然而,当前算法在进行SLP向量化时,对应用程序中可向量化循环的分析过程过于保守,导致...
关键词:向量化编译器 超字并行 依赖 有向图 可达性 
新型超字级并行改进算法
《计算机应用》2017年第2期450-456,462,共8页张素平 韩林 丁丽丽 王鹏翔 
"核高基"国家科技重大专项(2009ZX01036-001-001-2)~~
对于超字级并行(SLP)算法不能有效地处理大型程序中并行代码率较小,且可向量化的代码中可能存在对向量化不利的代码的问题,提出了一种新型的SLP改进算法NSLPO。首先,将程序中不能向量化的非同构语句进行同构化处理,定位SLP丢失的向量化...
关键词:同构 节流法 向量化 超字级并行 补充图 
一种基于SLP的新型编译框架被引量:1
《计算机应用研究》2017年第1期21-26,共6页张素平 王冬 丁丽丽 王鹏翔 宫一 于海宁 
"核高基"国家科技重大专项资助项目(2009ZX01036-001-001-2)
对于SLP(superword level parallel)算法不能高效处理并行代码占有率较小的大型应用程序的问题,提出并评估了一种新型的基于改进的SLP算法的编译框架。它主要包括三个阶段:将代码中结构相似的异构语句通过改进的SLP算法尽可能地改为同...
关键词:超字并行 同构 超字重用 数据布局 
循环展开技术在向量程序中的应用被引量:2
《计算机科学》2016年第1期226-231,245,共7页高伟 赵荣彩 于海宁 张庆花 
"核高基"国家科技重大专项(2009ZX01036-001-001-2);数学工程与先进计算国家重点实验室开放课题(2013A11)资助
循环展开是一项常用的循环优化技术。当前针对串行程序的循环展开技术已经比较成熟,但是在实际应用中没有针对向量程序进行有效的循环展开。为了解决这个问题,提出了一种面向向量程序的循环展开技术。首先,针对向量寄存器压力和代码膨...
关键词:向量程序 循环展开 展开因子 完全展开 
SIMD自动向量化编译优化概述被引量:31
《软件学报》2015年第6期1265-1284,共20页高伟 赵荣彩 韩林 庞建民 丁锐 
"核高基"国家科技重大专项(2009ZX01036-001-001-2)
SIMD扩展部件是集成到通用处理器中的加速部件,旨在发掘多媒体程序和科学计算程序的数据级并行.首先介绍SIMD扩展部件的背景和研究现状,然后从发掘方法、数据布局、多平台向量化这3个角度介绍了SIMD自动向量化的研究问题、困难和最新研...
关键词:SIMD扩展部件 自动向量化 数据级并行 编译优化 
面向异构多核处理器的分块交叉数据传输被引量:1
《信息工程大学学报》2015年第1期98-106,共9页李雁冰 赵荣彩 丁锐 赵博 
国家科技重大专项资助项目(2009ZX01036-001-001-2);国家重点实验室开放课题资助项目(2013A11)
由于异构多核处理器中加速设备内存有限,在进行加速计算时往往需要把主存中的数据分块传输到设备内存。Open ACC现有的数据拷贝子句不支持数据的分块传输,为此对Open ACC的数据拷贝子句进行扩展,引入分块规则数组区域表示方式,用于实现...
关键词:异构多核处理器 Open ACC 分块交叉数据传输 分块规则数组区域 自动并行化 
面向异构多核处理器的的循环分块被引量:4
《计算机工程与设计》2015年第1期168-173,共6页李雁冰 赵荣彩 赵博 黄品丰 
"核高基"国家科技重大专项基金项目(2009ZX01036-001-001-2);数学工程与先进计算国家重点实验室开放课题基金项目(2013A11)
将OpenACC编程模型用于异构多核处理器时,由于异构多核处理器加速设备内存有限,操作大量数据的代码不能获得很好的加速。针对这一问题,在OpenACC中引入循环分块子句,对循环进行分块处理,使每个循环块使用的数据能够存储在设备内存中;提...
关键词:异构多核处理器 循环分块 数据重用 OpenACC 自动并行化 
类型转换语句的SLP发掘方法被引量:2
《计算机科学》2014年第11期16-21,共6页赵博 赵荣彩 李雁冰 高伟 
“核高基”国家科技重大专项(2009ZX01036-001-001-2)资助
多媒体技术的迅速发展使得越来越多的处理器集成了SIMD扩展,当前的编译器大多数都已实现了自动向量化功能。为了发掘迭代内并行,一些编译器在自动向量化模块中引入了SLP向量化方法。多媒体数据的密集存储和规则运算使得在处理多媒体数...
关键词:类型转换 数据重组 SLP SIMD 向量因子 
基于指向更新的优先权指针分析算法被引量:1
《软件学报》2014年第11期2486-2498,共13页刘鹏 赵荣彩 庞建民 姚远 
国家高技术研究发展计划(863)(2009AA012201);"核高基"国家科技重大专项(2009ZX01036-001-001-2)
指针分析是数据流分析中的关键性技术,其分析结果是编译优化和程序变换的基础.在基于包含的指针分析算法研究的基础上,对Narse优先权约束评估算法中存在的冗余约束评估和优先权评估模型计算开销较大的问题进行分析,以指针的指向集更新...
关键词:指针分析 数据流分析 指向集 流不敏感 
检索报告 对象比较 聚类工具 使用帮助 返回顶部