卷积神经网络的FPGA并行加速方案设计被引量：27

FPGA-based design for convolution neural network

出　　处：《计算机工程与应用》2015年第8期32-36,共5页Computer Engineering and Applications

基　　金：国家高技术研究发展计划(863)(No.2010AA012302;No.2013AA01A208);国家自然科学基金(No.61040048;No.61303003;No.41374113)

摘　　要：根据卷积神经网络的特点,提出了深度流水的FPGA加速方案,设计了卷积层的通用卷积电路。该卷积电路可以在一个时钟周期内获得一个计算结果。理论上,该方案对于MNIST数据集,在28×28个时钟周期内可以获得一幅图片的运算结果。针对网络训练过程的前向传播阶段,在网络结构和数据集相同的情况下,对GPU,FPGA,CPU进行了在计算效率和能耗之间的比较。其中在计算效率方面,50 MHz频率的FPGA就可以相较于GPU实现近5倍的加速,相较于12核的CPU实现8倍的加速。而在功耗方面,该FPGA的实现方案只有GPU版本的26.7%。According to the characteristics of the Convolution Neural Network（CNN）, a FPGA-based acceleration pro-gram which uses deep-pipeline architecture is proposed for the MNIST data set. In this program, theoretically 28 ＆#215; 28 clock cycles can finish the whole calculation and get the output of the CNN. For the propagation stage of the training pro-cess, and in the same network structure and the same data set, this FPGA program with 50 MHz frequency can achieve nearly five times speedup compared to GPU version（Caffe）, achieve eight times speedup compared to 12 CPU cores. While the FPGA program just costs 26.7%power which GPU version costs.

关键词：卷积神经网络现场可编程门阵列(FPGA) 深度流水加速

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

卷积神经网络的FPGA并行加速方案设计被引量：27

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

卷积神经网络的FPGA并行加速方案设计 被引量：27

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

卷积神经网络的FPGA并行加速方案设计被引量：27