检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:赵安 张轶[1] ZHAO An;ZHANG Yi(College of Computer Science,Sichuan University,Chengdu 610065,China)
出 处:《计算机工程与设计》2024年第7期2134-2141,共8页Computer Engineering and Design
基 金:国家自然科学基金区域创新联合基金项目(U20A20161)。
摘 要:为提升传统Transformer结构追踪器的性能并解决与注意力机制结合的问题,提出一种具有注意力机制的Transformer结构视觉跟踪器(称为EVOTA)。提出一个具有局部跨通道的交互策略的通道注意力模块,通过显式建模通道之间的相互依赖关系实现自适应校准通道方向的特征响应。受神经科学理论启发,提出一个能量函数分析神经网络中每个神经元的重要性,进一步推断其相应三维权重。在多个基准数据集上,EVOTA的性能优于多种优秀的追踪器。To improve the tracking performance of traditional Transformer-based tracker and solve the problem of attention mecha-nism combination,a Transformer-based visual tracker with attention mechanism(called EVOTA)was proposed.A channel-wise attention module with local cross-channel interaction strategy was developed to re-calibrate the channel-wise feature responses in an adaptive way by modelling interdependencies explicitly between channels.Inspired by neuroscience theories,an energy function was proposed to analyze the importance of each neuron and infer their 3D weights.On multiple benchmark datasets,EVOTA outperforms many excellent trackers.
关 键 词:注意力机制 视觉追踪 Transformer结构 卷积神经网络 深度学习 特征融合 孪生网络
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.124