检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:崔伟 段迅[1] 孔广黔[1] 龙慧云[1] CUI Wei;DUAN Xun;KONG Guang-qian;LONG Hui-yun(School of Computer Science and Technology,Guizhou University,Guiyang Guizhou 550025,China)
机构地区:[1]贵州大学计算机科学与技术学院,贵州贵阳550025
出 处:《计算机仿真》2025年第3期216-225,共10页Computer Simulation
基 金:国家自然科学基金(62266011);贵州省基础研究计划项目(黔科合基础-ZK[2022]一般119)。
摘 要:针对现有目标跟踪算法存在目标感知能力较弱、实时性不足以及目标易丢失的问题,提出一种结合金字塔池化和目标运动轨迹的单目标跟踪算法(Pyramid pooling Transformer for single object tracking,PPTTrack)。首先,算法采用PVT作为骨干网络构建深度神经网络,建立模板图和搜索图之间的双向信息流通道,提升跟踪算法的目标感知能力;其次,在骨干网络中引入金字塔池化方法缩短K,V的序列长度,降低模型复杂度,提高算法运行速率;最后,将跟踪目标的运动轨迹构建为一个Motion Token输入到编码器中进行特征融合,利用运动轨迹连续性预测目标位置,以解决目标丢失问题。实验结果表明,上述算法在GOT-10K、LaSOT、UAV123以及TrackingNet四个基准数据集上的性能均达到了较为先进的水平。Aiming at the problems of weak target perception ability,insufficient real-time performance,and easy loss of targets in existing target tracking algorithms,a Pyramid Pooling Transformer for Single Object Tracking(PPTTrack)is proposed,which combines pyramid pooling and target motion trajectory.Firstly,the algorithm uses PVT as the backbone network to build a deep neural network,which establishes a bidirectional information flow channel between the template graph and the search graph to improve the target perception capability of the tracking algorithm.Token is input to the encoder for feature fusion,and the motion trajectory continuity is used to predict the target position in order to solve the target loss problem.The experimental results show that the algorithm achieves a more advanced performance on four benchmark datasets,namely GOT-10K,LaSOT,UAV123 and TrackingNet.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.171