检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:厍向阳[1] 颜唯佳 董立红[1] SHE Xiangyang;YAN Weijia;DONG Lihong(College of Computer Science and Technology,Xi’an University of Science and Technology,Xi’an 710054,China)
机构地区:[1]西安科技大学计算机科学与技术学院,西安710054
出 处:《计算机工程与应用》2024年第19期178-189,共12页Computer Engineering and Applications
基 金:陕西省自然科学基础研究项目(2019JLM-11);陕西省科技计划(2021JQ-576);陕西省教育厅项目(19JK0526)。
摘 要:针对当前单目3D目标检测中存在的漏检和多尺度目标检测效果不佳的问题,提出了一种基于Contextual Transformer的自动驾驶单目3D目标检测算法(CM-RTM3D)。在ResNet-50网络中引入Contextual Transformer(CoT),构建ResNet-Transformer架构以提取特征。设计多尺度空间感知模块(MSP),通过尺度空间响应操作改善浅层特征的丢失情况,嵌入沿水平和竖直两个空间方向的坐标注意力机制(CA),使用softmax函数生成各尺度的重要性软权重。在偏移损失中采用Huber损失函数代替L1损失函数。实验结果表明:在KITTI自动驾驶数据集上,相较于RTM3D算法,该算法在简单、中等、困难三个难度级别下,AP3D分别提升了4.84、3.82、5.36个百分点,APBEV分别提升了4.75、6.26、3.56个百分点。Aiming at the current problems of leakage and poor multi-scale target detection in monocular 3D object detection,a monocular 3D object detection algorithm for autonomous driving based on Contextual Transformer(CM-RTM3D)is proposed.Firstly,Contextual Transformer(CoT)is introduced into the ResNet-50 network to construct the ResNetTransformer architecture for feature extraction.Secondly,the multi-scale spatial perception(MSP)module is designed to improve the loss of shallow features through scale-space response operations,embedding the coordinate attention mechanism(CA)along both horizontal and vertical spatial directions,and generating soft weights of importance at each scale using the softmax function.Finally,the Huber loss function is used instead of the L1 loss function in the offset loss.The experimental results show that,compared with the RTM3D algorithm on the KITTI autopilot dataset,the algorithm in this paper improves AP3D by 4.84,3.82,and 5.36 percentage points,and APBEV by 4.75,6.26,and 3.56 percentage points,respectively,at the three difficulty levels of easy,medium,and difficult.
关 键 词:自动驾驶 单目3D目标检测 Contextual Transformer 多尺度感知 坐标注意力机制
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.43