检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:乔瑞秀[1,2] 陈刚 龚国良[1] 鲁华祥[1,2,3,4] QIAO Ruixiu;CHEN Gang;GONG Guoliang;LU Huaxiang(Institute of Semiconductors,Chinese Academy of Sciences,Beijing,100083,China;University of the Chinese Academy of Sciences,Beijing,100049,China;Center for Excellence in Brain Science and Intelligence Technology,Chinese Academy of Sciences,Shanghai,200031,China;Semiconductor Neural Network Intelligent Perception and Computing Technology Beijing Key Lab,Beijing 100083,China)
机构地区:[1]中国科学院半导体研究所,北京100083 [2]中国科学院大学,北京100049 [3]中国科学院脑科学与智能技术卓越创新中心,上海200031 [4]半导体神经网络智能感知与计算技术北京市重点实验室,北京100083
出 处:《西安电子科技大学学报》2019年第3期130-139,共10页Journal of Xidian University
基 金:中国科学院战略性先导科技专项(A类)超导计算机研发(XDA18000000);北京市科技计划(Z181100001518006);国家自然科学基金青年基金(61701473、61401423);中国科学院STS计划(KFJ-STS-ZDTP-070);中国科学院国防科技创新基金(CXJJ-17-M152)
摘 要:由于深度卷积神经网络的卷积层通道规模及卷积核尺寸多样,现有加速器面对这些多样性很难实现高效计算。为此,基于生物脑神经元机制提出了一种深度卷积神经网络加速器。该加速器拥有类脑神经元电路的多种分簇方式及链路组织方式,可以应对不同通道规模。设计了3种卷积计算映射,可以应对不同卷积核大小;实现了局部存储区数据的高效复用,可大量减少数据搬移,提高了计算性能。分别以目标分类和目标检测网络进行测试,该加速器的计算性能分别达498.6×10^9次/秒和571.3×10^9次/秒;能效分别为582.0×10^9次/(秒·瓦)和651.7×10^9次/(秒·瓦)。In deep convolutional neural networks,the diversity of channel sizes and kernel sizes makes it difficult for existing accelerators to achieve efficient calculations. Therefore, based on the biological brain neuron mechanism, a deep convolutional neural network accelerator is proposed which can provide not only multiple clustering methods for brain-like neurons and link organization among brain-like neurons towards different channel sizes, but also three mapping methods for different convolution kernel sizes. The accelerator implements efficient reuse of local memory data, which greatly reduces the amount of data movement and improves the computing performance. Tested by the object classification network and object detection network, the accelerator's computational performance is 498.6 GOPS and 571.3 GOPS, respectively;the energy efficiency is 582.0 GOPS/W and 651.7 GOPS/W, respectively.
关 键 词:深度神经网络 加速器 可重构结构 高性能 超大规模集成电路
分 类 号:TN4[电子电信—微电子学与固体电子学]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.144.127.26