检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:朱晨鹏 彭宏京 刘学军 ZHU Chen-peng;PENG Hong-jing;LIU Xue-jun(College of Computer Science and Technology,Nanjing Tech University,Nanjing 211816,China)
机构地区:[1]南京工业大学计算机科学与技术学院,江苏南京211816
出 处:《计算机工程与设计》2022年第7期2007-2014,共8页Computer Engineering and Design
基 金:国家重点研发计划基金项目(2018YFC0808500)。
摘 要:针对双线性卷积网络忽略特征图中不同通道和空间位置对分类的不同作用问题,提出一种基于双注意力机制的核化双线性卷积网络模型。从通道和空间两个维度上对局部区域进行双注意力建模,通道注意力机制对通道加权,空间注意力机制对位置加权,将两个机制的注意力特征图矩阵相加后进行外积聚合。采用sigmoid核函数对外积矩阵进行核化,建模通道间的非线性关系。实验在CUB-200-2011、FGVC-Aircraft以及Standford-Cars这3个细粒度数据集上对该方法进行测试,实验结果表明,该方法在3个数据集上均优于同类方法。Aiming at the problems that Bilinear CNN(B-CNN)ignores the different roles of each channel and spatial position in classification,a kernelized bilinear convolutional network model based on dual attention mechanism was proposed.Dual-attention modeling for the local parts was carried out from two dimensions of channel and space,in which the channel attention mechanism weighted the channel and the spatial attention mechanism weighted the position.The attention feature maps of two mechanisms were added together to perform outer product aggregation.The sigmoid kernel function was used to kernel the outer product matrix to capture the nonlinear correlation between channels.This method was evaluated on three fine-grained datasets of CUB-200-2011,FGVC-Aircraft and Stanford-Cars.Experimental results show that the method is superior to its counterparts on all three datasets.
关 键 词:双注意力机制 双线性卷积网络 核函数 外积聚合 细粒度图像分类
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49