检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:尹文志 赵仲元[1] 毛志刚[1] 王琴[1] 绳伟光[1] YIN Wen-zhi;ZHAO Zhong-yuan;MAO Zhi-gang;WANG Qin;SHENG Wei-guang(School of Electronic Information and Electrical Engineering,Shanghai JiaoTong University,Shanghai 200240,China)
机构地区:[1]上海交通大学电子信息与电气工程学院
出 处:《微电子学与计算机》2019年第8期45-48,53,共5页Microelectronics & Computer
基 金:国家自然科学基金项目(61176037、61201059)
摘 要:利用硬件和软件协同的设计技术来进一步提高粗粒度可重构加速器在处理循环时的编译时间与面积效率(单位面积的性能).在硬件方面将处理单元内部的寄存器堆结构优化,用旁路互联的方式替代.软件方面基于这种结构提出了一种新颖,高效的循环映射算法.该算法相对于同期的研究算法,极大的缩小了搜索最优解决方案的空间.利用前向贪婪和反向回溯迭代运行,可以获得快速而又稳定的编译时间,同时保证了接近最优解的性能.在上述硬件与软件协同的解决方案下,架构的面积与计算效率得到了提升.实验数据显示,将本文的编译框架与最新技术比较,编译速度可提升1955倍,面积效率提升到1.36倍.This paper provides a hardware and software co-design technique to optimize the compilation time and area efficiency of loop acceleration on Coarse-Grained Reconfigurable Architectures (CGRAs).From the hardware prospective,the architecture of each processing element(PE)is optimized by replacing register file within PE with bypass logic.On the software side,we develop a novel and efficient loop mapping algorithm,which greatly shrinks the search space for the optimal solution.The iteration of forward greedy placement and backward recovery obtains a fast and stable compile speed and guarantees performance close to the optimal solution.This hardware and software co-design method improves the area and computation efficiency.Experiment result shows that our framework improves1955xin compile speed and obtainsa 1.25xarea efficiency.
分 类 号:TP312[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.15.31.125