检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]天津大学精密测试技术与仪器国家重点实验室,天津300072 [2]天津商业大学机械工程学院,天津300134
出 处:《红外技术》2018年第1期47-54,共8页Infrared Technology
基 金:精密测试技术及仪器国家重点实验室开放基金资助项目(PIL1407);天津市科技兴海项目(KJXH2012-11)
摘 要:为了适应视觉跟踪过程中目标外观变化,提高视觉跟踪算法的鲁棒性,本文基于卷积神经网络(Convolutional Neural Network,CNN)并结合多域学习法与多模板管理,提出一种通过树形结构管理多模板的多域卷积神经网络(Multi-Domain CNNs with Multiple Models in a tree structure)视觉跟踪算法。首先使用大量已标记目标位置的视频数据预训练多域结构的CNN,使CNN卷积层可从图像中提取出适用于跟踪任务的特征。然后在跟踪时中对CNN全连接层进行微调以适应跟踪目标,并使用树形结构管理存储不同时间段的目标模板得到模板树。使用模板树综合评价待检测帧,估计目标位置。最后按照一定规则将新模板添加进模板树,完成模板的更新。实验表明,该算法对跟踪过程中目标外观的变化有着良好的适应性,同时多模板可抑制CNN在跟踪时产生的模板漂移问题。To solve the problem of visually tracking a target that changes its appearance and improve the robustness of visual tracking, we propose a convolutional neural network (CNN)-based algorithm that combines a multidomain learning framework and multiple models stored in a tree structure. First, the multidomain CNN is pretrained with many videos containing tracking ground truths, so that its convolutional layer can extract features appropriate for visual tracking. During tracking, the fully connected layers are fine-tuned online to fit the target appearance, and the multiple target appearance models are managed in a tree structure. Then, the model tree is used to estimate the target’s state in a new frame. Finally, a new model is updated along a path in the model tree. The algorithm produces outstanding performance when a target abruptly changes its appearance. Furthermore, the model tree can fix the problem of drift during online learning with the CNN.
关 键 词:视觉跟踪 深度学习 卷积神经网络 多域学习 多模板
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.20.233.121