无锚框目标检测模型特征任务不对齐研究  被引量:1

Research on Feature Misalignment Between Tasks in Anchor-Free Models

在线阅读下载全文

作  者:郝帅征 刘宏哲 HAO Shuaizheng;LIU Hongzhe(Beijing Key Laboratory of Information Service Engineering,Beijing Union University,Beijing 100101,China;College of Robots,Beijing Union University,Beijing 100101,China)

机构地区:[1]北京联合大学北京市信息服务工程重点实验室,北京100101 [2]北京联合大学机器人学院,北京100101

出  处:《计算机工程与应用》2023年第11期151-159,共9页Computer Engineering and Applications

基  金:国家自然科学基金(61871039,62102033,62171042,62006020,61906017);北京市教委项目(KM202111417001,KM201911417001);视觉智能协同创新中心项目(CYXC2011);北京联合大学学术项目(BPHR2020DZ02,ZB10202003,ZK40202101,ZK120202104)。

摘  要:通常的目标检测模型由分类任务和回归任务构成。由于不同的任务驱动因素,模型中头部对应的这两个任务分支网络对来自同一输入图片、同一个实例的特征具有不同的敏感性。这就造成了检测模型对于相同位置的特征、分类效果和回归效果相差巨大的问题,也就是任务特征不对齐的问题。但是通用的目标检测后处理办法,仅以分类分数作为非极大抑制过程的标准,带来了大量回归质量较差、但置信度很高的检测结果。对现代化的无锚框网络展开不对齐问题的研究分析,将问题进一步拆解为尺度层级上的不对齐和空间位置上的不对齐。提出了参数量代价最小的解决方案:使用可变形卷积模块对检测模型头部网络的感受野进行微调,使用考虑样本点对齐效果的标签分配机制进行对齐样本点的挖掘,创新性地解决了上述两个子问题。进一步的详细实验和对比分析证明了该工作的有效性和实用性,以及对不同特征提取骨干网络的鲁棒性。General object detection models consist of classification and regression branches.Due to different task drivers,they have a different sensibility to the features from the exact instances.That causes a vast performance gap,the so-called task-feature misalignment problem.Based on the assumption that the candidate result with high classification confidence has a high regression quality,the standard prediction method employs only the classification score as the criterion in NMS procedures.That leads to many prediction results with high classification scores but poor regression qualities.This paper mainly researches the misalignment problem in modern anchor-free detection models,specifically decomposing the problem with scale and spatial misalignment.It proposes to resolve the problem at minimal cost-a minor modification of the head network,which tweaks the receptive field of two tasks individually,and a new label assignment method mining the most aligned feature samples.The experiments show that,compared to the baseline FCOS,a one-stage anchor-free object detection model,the model consistently gets around 3 AP improvements with different backbones,demonstrating the method’s simplicity and efficiency.

关 键 词:目标检测 深度学习 无锚框检测器 标签分配机制 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象