基于注意力机制的增强视觉追踪网络  

Enhanced visual object tracking network based on attention mechanism

在线阅读下载全文

作  者:赵安 张轶[1] ZHAO An;ZHANG Yi(College of Computer Science,Sichuan University,Chengdu 610065,China)

机构地区:[1]四川大学计算机学院,四川成都610065

出  处:《计算机工程与设计》2024年第7期2134-2141,共8页Computer Engineering and Design

基  金:国家自然科学基金区域创新联合基金项目(U20A20161)。

摘  要:为提升传统Transformer结构追踪器的性能并解决与注意力机制结合的问题,提出一种具有注意力机制的Transformer结构视觉跟踪器(称为EVOTA)。提出一个具有局部跨通道的交互策略的通道注意力模块,通过显式建模通道之间的相互依赖关系实现自适应校准通道方向的特征响应。受神经科学理论启发,提出一个能量函数分析神经网络中每个神经元的重要性,进一步推断其相应三维权重。在多个基准数据集上,EVOTA的性能优于多种优秀的追踪器。To improve the tracking performance of traditional Transformer-based tracker and solve the problem of attention mecha-nism combination,a Transformer-based visual tracker with attention mechanism(called EVOTA)was proposed.A channel-wise attention module with local cross-channel interaction strategy was developed to re-calibrate the channel-wise feature responses in an adaptive way by modelling interdependencies explicitly between channels.Inspired by neuroscience theories,an energy function was proposed to analyze the importance of each neuron and infer their 3D weights.On multiple benchmark datasets,EVOTA outperforms many excellent trackers.

关 键 词:注意力机制 视觉追踪 Transformer结构 卷积神经网络 深度学习 特征融合 孪生网络 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象