检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:郑思杰 李杰 贺光辉[1] ZHENG Sijie;LI Jie;HE Guanghui(School of Electronic Information and Electrical Engineering,Shanghai Jiao Tong University,Shanghai 200240;Shanghai Academy of Spaceflight Technology(SAST),Shanghai 201109)
机构地区:[1]上海交通大学电子信息与电气工程学院,上海200240 [2]上海航天测控通信研究所,上海201109
出 处:《现代计算机》2021年第18期38-43,共6页Modern Computer
基 金:国家重点研发计划项目(No.2019YFB2204500);上海航天先进技术联合研究基金项目(No.USCAST2019-28)。
摘 要:目标检测网络算法具有更高的检测精度,但庞大的计算复杂度使得传统硬件难以满足实时计算需求。为此,一种面向低延时目标检测的FPGA神经网络加速器被设计研究。该加速器能够支持高并行卷积稀疏计算,进而优化计算延时;同时设计了集中式存储阵列结构,能够实现存储阵列和计算阵列非一一对应的数据交互。基于Xilinx VCU118开发板和YOLOv3深度神经网络的测试结果显示,加速器单帧延时只有24.36 ms,并具有2704 GOPS的吞吐性能和更高的面积效率。The object detection network algorithms have higher detection accuracy.However,the huge computational complexity makes it difficult for traditional processors to realize real-time processing.Therefore,a neural network accelerator based on FPGA is proposed for low-latency object detection.It can support high-parallel convolutional sparse calculating,which improves the parallelism and reduces the calculation delay.Also,a centralized storage array structure is designed to achieve non-one-to-one data interaction between storage array and comput⁃ing array.Finally,the YOLOv3 network is implemented on the Xilinx VCU118 development board.The accelerator delay is only 24.36 ms,achieving 2704 GOPS throughput and higher area efficiency.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222