面向自动搜索型神经网络的加速器设计与实现  被引量:1

Accelerator design and implementation for automatic searching neural network

在线阅读下载全文

作  者:贺文 祝永新 汪辉[2] 黄尊恺 HE Wen;ZHU Yongxin;WANG Hui;HUANG Zunkai(School of Microelectronics,University of Chinese Academy of Sciences,Beijing 100049,China;Shanghai Advanced Research Institute,Chinsed Academy of Sciences,CIS Lab,Shanghai 201210,China)

机构地区:[1]中国科学院大学微电子学院,北京100049 [2]中国科学院上海高等研究院感知与计算实验室,上海201210

出  处:《微电子学与计算机》2021年第11期88-94,共7页Microelectronics & Computer

基  金:国家重点研发计划(2019YFB2204204);上海浦东科技与经济委员会科研计划项目(PKX2019-D02);上海市科学技术委员会科研计划项目(19511131202);中国科学院战略性先导科技专项(C类)(XDC02070800);中科院上海高等研究院院内人才项目(E052891ZZ1);上海高等研究院与上海光源合作项目(E0560W1ZZ0)。

摘  要:近年来,通过神经网络架构搜索(NAS)得到的自动搜索型神经网络在视觉任务中表现尤为突出,然而,其更为复杂多变的卷积规模和运算方式限制了其在边缘侧设备的应用.为解决这一问题,针对自动搜索型神经网络搜索空间中各种复杂多变的计算方式,设计了一款可加速自动搜索型神经网络的高帧率高灵活度加速器.首先,针对其丰富的卷积类型提出了阵列复用混合卷积(AMMC)结构,不新增MAC阵列就能灵活地实现不同卷积在不同方向上的并行化处理.其次,提出了一种可变精度的可配置多路选择激活(CMA)结构,有效地实现了这类网络应用的多种激活函数的高精度拟合.将MAC阵列规模为32*32的加速器部署到Xilinx的zcu102芯片上,时钟频率可达200 MHz,加速器功耗为3.2 w;移植MnasNet-a1对224×224尺寸图片处理的实际运行帧率为272.9 fps.In recent years,the Automatic Searching Neural Networks obtained through Neural Architecture Search(NAS)has performed quite prominently in visual tasks,but their complex and variable convolution scale and convolution types limit their application in edge-side devices.To solve this problem,a high flexibility and high frame rate accelerator is proposed to accelerate automatic searching neural networks represented by MnasNet.Firstly,the Array Multiplexing Mixed Convolution(AMMC)structure is proposed for its rich convolution types,which can realize the parallel processing of different convolutions in different directions without using additional MAC resources.Secondly,a variable precision Configurable Multiple Selection Activation(CMA)structure is proposed,which can effectively realize the high-precision fitting of various activation functions.When the accelerator is deployed on the zcu102 chip of Xilinx with a 32*32 MAC scale,the clock frequency can reach 200 MHz,the power consumption of the accelerator is 3.2 w,and the actual operating frame rate for 224×224 size image of MnasNet-a1 is 272.9 fps.

关 键 词:自动搜索型神经网络 阵列复用 混合并行度 可变精度 FPGA 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象