检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:贺文 祝永新 汪辉[2] 黄尊恺 HE Wen;ZHU Yongxin;WANG Hui;HUANG Zunkai(School of Microelectronics,University of Chinese Academy of Sciences,Beijing 100049,China;Shanghai Advanced Research Institute,Chinsed Academy of Sciences,CIS Lab,Shanghai 201210,China)
机构地区:[1]中国科学院大学微电子学院,北京100049 [2]中国科学院上海高等研究院感知与计算实验室,上海201210
出 处:《微电子学与计算机》2021年第11期88-94,共7页Microelectronics & Computer
基 金:国家重点研发计划(2019YFB2204204);上海浦东科技与经济委员会科研计划项目(PKX2019-D02);上海市科学技术委员会科研计划项目(19511131202);中国科学院战略性先导科技专项(C类)(XDC02070800);中科院上海高等研究院院内人才项目(E052891ZZ1);上海高等研究院与上海光源合作项目(E0560W1ZZ0)。
摘 要:近年来,通过神经网络架构搜索(NAS)得到的自动搜索型神经网络在视觉任务中表现尤为突出,然而,其更为复杂多变的卷积规模和运算方式限制了其在边缘侧设备的应用.为解决这一问题,针对自动搜索型神经网络搜索空间中各种复杂多变的计算方式,设计了一款可加速自动搜索型神经网络的高帧率高灵活度加速器.首先,针对其丰富的卷积类型提出了阵列复用混合卷积(AMMC)结构,不新增MAC阵列就能灵活地实现不同卷积在不同方向上的并行化处理.其次,提出了一种可变精度的可配置多路选择激活(CMA)结构,有效地实现了这类网络应用的多种激活函数的高精度拟合.将MAC阵列规模为32*32的加速器部署到Xilinx的zcu102芯片上,时钟频率可达200 MHz,加速器功耗为3.2 w;移植MnasNet-a1对224×224尺寸图片处理的实际运行帧率为272.9 fps.In recent years,the Automatic Searching Neural Networks obtained through Neural Architecture Search(NAS)has performed quite prominently in visual tasks,but their complex and variable convolution scale and convolution types limit their application in edge-side devices.To solve this problem,a high flexibility and high frame rate accelerator is proposed to accelerate automatic searching neural networks represented by MnasNet.Firstly,the Array Multiplexing Mixed Convolution(AMMC)structure is proposed for its rich convolution types,which can realize the parallel processing of different convolutions in different directions without using additional MAC resources.Secondly,a variable precision Configurable Multiple Selection Activation(CMA)structure is proposed,which can effectively realize the high-precision fitting of various activation functions.When the accelerator is deployed on the zcu102 chip of Xilinx with a 32*32 MAC scale,the clock frequency can reach 200 MHz,the power consumption of the accelerator is 3.2 w,and the actual operating frame rate for 224×224 size image of MnasNet-a1 is 272.9 fps.
关 键 词:自动搜索型神经网络 阵列复用 混合并行度 可变精度 FPGA
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.33