自动并行化

作品数:55被引量:92H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:赵荣彩康继昌丁锐韩林况正谦更多>>
相关机构:解放军信息工程大学西北工业大学中国科学技术大学西安交通大学更多>>
相关期刊:《计算技术与自动化》《西北师范大学学报(自然科学版)》《泉州师范学院学报》《电子科技文摘》更多>>
相关基金:国家科技重大专项国家高技术研究发展计划国家自然科学基金国防科技技术预先研究基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于机器学习的多面体模型下的循环置换
《信息技术》2023年第12期22-32,共11页彭畅 陈长波 
国家自然科学基金面上项目(11771421);中国科学院“西部之光”,重庆英才计划青年拔尖项目(20210002-63);重庆市院士牵头科技创新引导专项(cstc2019yszx-jcyjX0003,cstc2020yszx-jcyjX0005);国家重点研发计划(2020YFA0712300)。
针对现有多面体编译器默认调度性能欠佳的问题,提出了一种在给定问题规模下为循环程序预测最佳置换的方法。扩展Pluto以支持循环置换功能,构建决策树模型以在问题规模变化较大时预测最佳置换,构建回归模型以在问题规模相对集中时预测并...
关键词:机器学习 循环置换 循环程序优化 循环自动并行化 多面体模型 
基于LLVM Pass的复杂嵌套循环自动并行化框架被引量:3
《软件学报》2023年第7期3022-3042,共21页马春燕 吕炳旭 叶许姣 张雨 
国家自然科学基金(62192733,62062030);航空基金(20185853038,201907053004)。
随着多核处理器的普及应用,针对嵌入式遗留系统中串行代码的自动并行化方法是研究热点.其中,针对具有非完美嵌套结构、非仿射依赖关系特征的复杂嵌套循环的自动并行化方法存在技术挑战.提出了一种基于LLVMPass的复杂嵌套循环的自动并行...
关键词:复杂嵌套循环 自动并行化 LLVM Pass 依赖分析 
循环自动并行化技术研究被引量:1
《信息工程大学学报》2019年第1期82-89,共8页高雨辰 赵荣彩 韩林 李雁冰 
国家重点研发计划重点专项基金资助(2016YFB0200503)
伴随着并行体系结构和处理器芯片的发展,计算机系统提供的计算资源越来越多,结构越加复杂,程序员手工编写并行程序的难度也越来越大,自动并行化技术的研究显得愈发重要。首先通过现代体系结构支持的4种并行方式对循环自动并行化技术进...
关键词:自动并行化 循环并行方式 向量并行 
一种面向众核处理器的嵌套循环多维并行识别方法被引量:3
《计算机应用研究》2018年第11期3311-3314,共4页李颖颖 庞建民 李雁冰 翟胜伟 
国家自然科学基金面上项目(61472447);国家"863"计划资助项目(2014AA01A300);国家"核高基"重大专项资助项目
现有循环并行识别方法用于众核处理器时存在一定不足,当选择的循环并行维迭代数较少时可能导致严重的负载不均衡。针对这一问题,提出了一种面向众核处理器的多维并行识别方法。在现有并行识别方法无法做到较好的负载均衡时,选择嵌套循...
关键词:多维并行识别 众核处理器 自动并行化 嵌套循环 
典型编译器自动并行化效果和评估被引量:1
《信息工程大学学报》2018年第2期186-190,共5页王鹏翔 韩林 丁丽丽 张素平 王冬 
采用Spec CPU2006基准测试程序,对Intel编译器、Open64编译器和GCC编译器3个典型编译器自动并行化的效果进行评估,同时对GCC编译器进行深入分析,用程序片段评估GCC编译器自动并行化的能力,分析GCC编译器中现有自动并行化能力的不足,为...
关键词:自动并行化 典型编译器 并行编译技术 
分支嵌套循环的自动并行化研究被引量:3
《计算机科学》2017年第5期14-19,52,共7页丁丽丽 李雁冰 张素平 王鹏翔 张庆花 
国家高技术研究发展计划(863计划)(2009AA01220);"核高基"重大专项(2009zx01036-001-001-2)资助
GCC编译器是一种受广大研究者青睐的开源优化编译器,但它仅仅能够对完美嵌套循环进行依赖分析。为了更好地挖掘嵌套循环粗粒度的并行,深入研究了GCC5.1数据依赖分析过程,提出了一种能够处理分支嵌套循环的依赖测试方法。首先识别出分支...
关键词:数据依赖分析 GCC 完美嵌套循环 分支嵌套循环 距离向量 
基于JavaCC的C代码自动并行化的设计与实现被引量:5
《计算机应用》2016年第9期2422-2426,2431,共6页刘有耀 杨鹏程 
国家自然科学基金资助项目(61136002;61272120)~~
针对当前大量遗产代码无法重复利用的问题,设计一种新的编译工具将C的串行代码转换为基于MPI+Open MP的混合并行编程代码,降低了并行编程的开发成本。首先,通过对Java CC的优化,实现一种可以解析C语言的词法和语法分析器,进行源代码分...
关键词:JAVACC 抽象语法树 依赖性 自动并行化 MPI+OPENMP 
一种面向规则DOACROSS循环的自动并行化框架
《小型微型计算机系统》2016年第6期1365-1370,共6页张庆花 赵荣彩 李朋远 
核高基国家科技重大专项项目(2009ZX01036)资助
针对现有编译器对DOACROSS循环采取保守处理而造成程序并行性巨大损失的问题,本文提出了一种面向规则DOACROSS循环的自动并行框架.首先基于依赖测试提出了同步距离求解算法以确定嵌套循环的并行层、迭代分组层,以及同步语句插入点;其次...
关键词:DOACROSS循环 流水并行 同步距离 同步控制机制 流水粒度 
一种基于OpenMP的DSWP自动并行算法被引量:1
《信息工程大学学报》2015年第2期225-233,共9页刘晓娴 赵荣彩 韩林 李雁冰 
国家科技重大专项资助项目(009ZX01036-001-001-2)
多核处理器能够提升多线程程序的性能,但早已存在的诸多单线程程序无法从中获益,程序员也习惯于编写单线程程序。自动并行化技术是将单线程程序移植到多核上的重要手段,但是当循环中存在无法确定的数据依赖或复杂的控制流时,传统的自动...
关键词:自动并行化 OPENMP DSWP 
面向异构多核处理器的分块交叉数据传输被引量:1
《信息工程大学学报》2015年第1期98-106,共9页李雁冰 赵荣彩 丁锐 赵博 
国家科技重大专项资助项目(2009ZX01036-001-001-2);国家重点实验室开放课题资助项目(2013A11)
由于异构多核处理器中加速设备内存有限,在进行加速计算时往往需要把主存中的数据分块传输到设备内存。Open ACC现有的数据拷贝子句不支持数据的分块传输,为此对Open ACC的数据拷贝子句进行扩展,引入分块规则数组区域表示方式,用于实现...
关键词:异构多核处理器 Open ACC 分块交叉数据传输 分块规则数组区域 自动并行化 
检索报告 对象比较 聚类工具 使用帮助 返回顶部