检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:郝帅征 刘宏哲 HAO Shuaizheng;LIU Hongzhe(Beijing Key Laboratory of Information Service Engineering,Beijing Union University,Beijing 100101,China;College of Robots,Beijing Union University,Beijing 100101,China)
机构地区:[1]北京联合大学北京市信息服务工程重点实验室,北京100101 [2]北京联合大学机器人学院,北京100101
出 处:《计算机工程与应用》2023年第11期151-159,共9页Computer Engineering and Applications
基 金:国家自然科学基金(61871039,62102033,62171042,62006020,61906017);北京市教委项目(KM202111417001,KM201911417001);视觉智能协同创新中心项目(CYXC2011);北京联合大学学术项目(BPHR2020DZ02,ZB10202003,ZK40202101,ZK120202104)。
摘 要:通常的目标检测模型由分类任务和回归任务构成。由于不同的任务驱动因素,模型中头部对应的这两个任务分支网络对来自同一输入图片、同一个实例的特征具有不同的敏感性。这就造成了检测模型对于相同位置的特征、分类效果和回归效果相差巨大的问题,也就是任务特征不对齐的问题。但是通用的目标检测后处理办法,仅以分类分数作为非极大抑制过程的标准,带来了大量回归质量较差、但置信度很高的检测结果。对现代化的无锚框网络展开不对齐问题的研究分析,将问题进一步拆解为尺度层级上的不对齐和空间位置上的不对齐。提出了参数量代价最小的解决方案:使用可变形卷积模块对检测模型头部网络的感受野进行微调,使用考虑样本点对齐效果的标签分配机制进行对齐样本点的挖掘,创新性地解决了上述两个子问题。进一步的详细实验和对比分析证明了该工作的有效性和实用性,以及对不同特征提取骨干网络的鲁棒性。General object detection models consist of classification and regression branches.Due to different task drivers,they have a different sensibility to the features from the exact instances.That causes a vast performance gap,the so-called task-feature misalignment problem.Based on the assumption that the candidate result with high classification confidence has a high regression quality,the standard prediction method employs only the classification score as the criterion in NMS procedures.That leads to many prediction results with high classification scores but poor regression qualities.This paper mainly researches the misalignment problem in modern anchor-free detection models,specifically decomposing the problem with scale and spatial misalignment.It proposes to resolve the problem at minimal cost-a minor modification of the head network,which tweaks the receptive field of two tasks individually,and a new label assignment method mining the most aligned feature samples.The experiments show that,compared to the baseline FCOS,a one-stage anchor-free object detection model,the model consistently gets around 3 AP improvements with different backbones,demonstrating the method’s simplicity and efficiency.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7