面向类仿射型数组下标应用的参数化并行存储结构模板  被引量:1

A Parameterized Parallelism Memory Template for Affine Array Subscript Application

在线阅读下载全文

作  者:郭振华[1] 吴艳霞[1] 张国印[1] 戴葵 

机构地区:[1]哈尔滨工程大学计算机科学与技术学院

出  处:《电子学报》2016年第8期1956-1961,共6页Acta Electronica Sinica

基  金:国家自然科学基金(No.61003036);计算机体系结构国家重点实验室开放课题(No.CARCH201301);博士后科研启动基金(No.LBHQ12134);中央高校基本科研业务经费专项基金(No.HEUCF100606)

摘  要:为了解决目前可重构编译技术在为类仿射型数组下标应用生成循环流水阵列时,生成的存储系统对数据并行与重用支持不完善的问题,本文提出了一种参数化并行存储结构模板.此模板采用模块化设计思想,根据数据访存特征生成由多体交叉并行存储子模块、单体串行存储子模块、RAW Buffer缓存子模块及Smart Buffer缓存子模块构成的存储结构.为灵活生成存储结构及充分挖掘数据的并行性和重用性,本文采用访存数据依赖图方法计算存储模板的参数值.和相关工作相比,根据本文提出的存储结构模板生成的硬件,可以在占用较少的硬件资源情况下,获得较高的硬件执行速度.In current reconfigurable compiling approach for solving affine subscript operations,the automatic genera-ted feeding memory system is not optimal,especially to support an iteration pipeline structure.This paper presents a parame-terized parallel memory template to mine parallelism and reusability of data,which is considered to address the lack of such aspect in reconfigurable compilers at hand.According to the analysis of characteristics of data access to affine subscript ar-rays in pipeline iteration,our template configures alternative sub-structures such as parallel multi-bank memory,sequential access memory,RAW Buffer and Smart Buffer.Furthermore,in phase of calculating parameter values to fill the template,the memory data dependence graph method is used,in which approach the flexibility of way to create memory structure is kept. The experimental result shows that compared with related works,the compiler can generate reconfigurable hardware perform-ing a higher execution speed with less resources usage by employ the proposed memory template.

关 键 词:类仿射数组下标 可重构编译 存储结构 数据重用 模板 

分 类 号:TP302[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象