检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨雨迪 葛海波 辛世澳 薛紫涵 袁昊 YANG Yudi;GE Haibo;XIN Shiao;XUE Zihan;YUAN Hao(School of Electronic Engineering,Xi′an University of Posts and Telecommunications,Xi′an 710121,Shaanxi,China)
机构地区:[1]西安邮电大学电子工程学院,陕西西安710121
出 处:《计算机工程》2024年第11期284-296,共13页Computer Engineering
基 金:陕西省自然科学基金(2011JM8038);陕西省重点产业创新链(群)项目(S2019-YF-ZDCXL-0098)。
摘 要:为了应对遥感图像目标检测中小目标像素低、背景复杂、硬件资源有限等问题,提出一种融合超分辨率(SR)和特征增强的小目标检测模型。采用GhostNet网络中的Ghost卷积层替换YOLOv8网络中的传统卷积层Conv,在不影响检测精度的情况下降低网络模型的参数量和计算量。在主干网络中,构建超分辨率辅助增强(SRAE)模块提升图像的分辨率和特征提取能力。利用三层特征融合(TFF)模块,获取主干网络较低层的空间特征,改善快速空间金字塔池化(SPPF)层特征空间提取不足的问题,提高小目标空间定位能力。设计自注意力信息转移(SAT)模块,在保证模型轻量化的同时增强小目标的语义信息和全局信息。实验结果表明,改进模型在DIOR数据集上实现了90.5%的mAP@0.5、15.1×10^(6)的参数量和30.3×10^(9)的每秒浮点运算次数(FLOPs),相比于其他模型在实现网络轻量化的同时提升了小目标检测精度。To address the problems of low pixel size,complex background,and limited hardware resources in remote sensing image object detection,a small-object detection algorithm that combines Super-Resolution(SR)and feature enhancement is proposed.The Ghost convolution layers in the GhostNet are used to replace the conventional convolution layers,Conv,in the You Only Look Once v8(YOLOv8)network,reducing the number of parameters and calculations of the network model without compromising detection accuracy.A Super-Resolution Assisted Enhancement(SRAE)is built in the backbone network to improve image resolution and feature extraction capabilities.A Three-layer Feature Fusion(TFF)module is proposed to obtain the spatial features of the lower layer of the backbone network,improve the insufficient feature space extraction in the Spatial Pyramid Pooling Fast(SPPF)layer,and enhance the spatial positioning ability of small targets.A Self-Attention information Transfer(SAT)module is designed to enhance the semantic and global information of small targets while ensuring a lightweight model.The improved model achieves 90.5%Mean Average Precision(mAP)@0.5,15.1×10^(6) parameter quantity,and 30.3×10^(9) Floating Point Operations Per Second(FLOPs)on the DIOR dataset;additionally,it achieves lightweight while improving detection accuracy compared to other models.
关 键 词:目标检测 超分辨率 遥感图像 YOLOv8网络 注意力机制 特征融合
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.188.71.235