检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨永杰[1] 郑君泰 马立 杨昊 YANG Yongjie;ZHENG Juntai;MA Li;YANG Hao(School of Information Science and Technology,Nantong University,Nantong 226019)
出 处:《北京大学学报(自然科学版)》2024年第6期1001-1008,共8页Acta Scientiarum Naturalium Universitatis Pekinensis
摘 要:提出一种基于改进型LeNet的交通标志多分类异构加速器的实现方案。该加速器利用ARM+FPGA异构平台,将改进型LeNet的前向推理部署到FPGA上,实现并行计算。在FPGA端,采用AXI-Stream协议,通过DMA实现数据高速流转,使用数组分区和多级流水线等技术实现数据的并行处理。在ARM端使用PYNQ框架进行数据更新和加速器调度。在GTSRB数据集上的实验结果显示,该设计方案在工作时钟频率为50 MHz时,平均推理时间为14.489 ms,在MCU上的推理时间为710 ms,加速比可达49,对于实现交通标识多分类的边缘端应用具有显著的作用。An implementation of traffic sign multi-classification heterogeneous accelerator based on improved LeNet is proposed.The accelerator utilizes an ARM+FPGA heterogeneous platform to deploy the forward inference of the improved LeNet on the FPGA for parallel computing.On the FPGA side,the AXI-Stream protocol is employed with DMA to achieve high-speed data streaming,and techniques such as array partitioning and multi-level pipeline are utilized for parallel data processing.On the ARM side,the PYNQ framework is used for data updates and accelerator scheduling.Experimental results on GTSRB demonstrate that proposed design achieves an average inference time of 14.489 ms at a working clock frequency of 50 MHz,compared to 710 ms on the MCU,resulting in a speedup of up to 49 times.This design provides significant assistance for edge applications involving traffic sign multi-classification.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] TP391.41[自动化与计算机技术—控制科学与工程] U495[交通运输工程—交通运输规划与管理]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38