一种改进型LeNet的交通标识多分类异构加速器的实现  

Implementation of an Improved LeNet Traffic Sign Multi-classification Heterogeneous Accelerator

在线阅读下载全文

作  者:杨永杰[1] 郑君泰 马立 杨昊 YANG Yongjie;ZHENG Juntai;MA Li;YANG Hao(School of Information Science and Technology,Nantong University,Nantong 226019)

机构地区:[1]南通大学信息科学技术学院,南通226019

出  处:《北京大学学报(自然科学版)》2024年第6期1001-1008,共8页Acta Scientiarum Naturalium Universitatis Pekinensis

摘  要:提出一种基于改进型LeNet的交通标志多分类异构加速器的实现方案。该加速器利用ARM+FPGA异构平台,将改进型LeNet的前向推理部署到FPGA上,实现并行计算。在FPGA端,采用AXI-Stream协议,通过DMA实现数据高速流转,使用数组分区和多级流水线等技术实现数据的并行处理。在ARM端使用PYNQ框架进行数据更新和加速器调度。在GTSRB数据集上的实验结果显示,该设计方案在工作时钟频率为50 MHz时,平均推理时间为14.489 ms,在MCU上的推理时间为710 ms,加速比可达49,对于实现交通标识多分类的边缘端应用具有显著的作用。An implementation of traffic sign multi-classification heterogeneous accelerator based on improved LeNet is proposed.The accelerator utilizes an ARM+FPGA heterogeneous platform to deploy the forward inference of the improved LeNet on the FPGA for parallel computing.On the FPGA side,the AXI-Stream protocol is employed with DMA to achieve high-speed data streaming,and techniques such as array partitioning and multi-level pipeline are utilized for parallel data processing.On the ARM side,the PYNQ framework is used for data updates and accelerator scheduling.Experimental results on GTSRB demonstrate that proposed design achieves an average inference time of 14.489 ms at a working clock frequency of 50 MHz,compared to 710 ms on the MCU,resulting in a speedup of up to 49 times.This design provides significant assistance for edge applications involving traffic sign multi-classification.

关 键 词:LeNet FPGA PYNQ 异构计算 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] TP391.41[自动化与计算机技术—控制科学与工程] U495[交通运输工程—交通运输规划与管理]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象