基于自然语言查询的视觉目标跟踪方法综述  

A review of visual object tracking by natural language specification

在线阅读下载全文

作  者:马丁 邬向前[1] MA Ding;WU Xiangqian(School of Computer Science and Technology,Harbin Institute of Technology,Harbin 150001,China)

机构地区:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001

出  处:《智能计算机与应用》2024年第12期195-199,共5页Intelligent Computer and Applications

基  金:国家自然科学基金青年科学基金(20230197)。

摘  要:基于自然语言查询的视觉目标跟踪方法是一个新兴的研究热点,旨在利用自然语言查询来锁定目标在视频帧中的位置。与需要手工标注矩形框的视觉目标跟踪方法不同,基于自然语言查询的视觉目标跟踪方法通过高级语义信息来指导跟踪器,旨在消除包含歧义性的手工标注矩形框,并将本地搜索与全局搜索有机地结合起来。因此,基于自然语言查询的视觉目标跟踪方法能够在实际场景中带来更灵活、稳健和准确的跟踪性能。综上所述,本文对基于自然语言查询的视觉目标跟踪方法进行综述,概述相关原理和模型改进的关键技术,总结不同网络结构的优缺点。Visual object tracking by natural language specification is an emerging research hotspot,which aims to use natural language specification to locate the position of the target in video frames.Unlike visual object tracking methods that require manual annotation of rectangular boxes,visual object tracking method based on natural language query guides the tracker through advanced semantic information,aiming to eliminate ambiguous manual annotation of rectangular boxes and combine local search with global search.Therefore,tracking by natural language specification can bring more flexible,robust and accurate tracking performance in practical scenarios.In summary,this article reviews visual object tracking by natural language specification,outlines the key technologies of related principles and model improvements,and summarizes the advantages and disadvantages of different network structures.

关 键 词:自然语言查询 视觉目标跟踪 异质特征融合 

分 类 号:TP399[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象