检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:马丁 邬向前[1] MA Ding;WU Xiangqian(School of Computer Science and Technology,Harbin Institute of Technology,Harbin 150001,China)
机构地区:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001
出 处:《智能计算机与应用》2024年第12期195-199,共5页Intelligent Computer and Applications
基 金:国家自然科学基金青年科学基金(20230197)。
摘 要:基于自然语言查询的视觉目标跟踪方法是一个新兴的研究热点,旨在利用自然语言查询来锁定目标在视频帧中的位置。与需要手工标注矩形框的视觉目标跟踪方法不同,基于自然语言查询的视觉目标跟踪方法通过高级语义信息来指导跟踪器,旨在消除包含歧义性的手工标注矩形框,并将本地搜索与全局搜索有机地结合起来。因此,基于自然语言查询的视觉目标跟踪方法能够在实际场景中带来更灵活、稳健和准确的跟踪性能。综上所述,本文对基于自然语言查询的视觉目标跟踪方法进行综述,概述相关原理和模型改进的关键技术,总结不同网络结构的优缺点。Visual object tracking by natural language specification is an emerging research hotspot,which aims to use natural language specification to locate the position of the target in video frames.Unlike visual object tracking methods that require manual annotation of rectangular boxes,visual object tracking method based on natural language query guides the tracker through advanced semantic information,aiming to eliminate ambiguous manual annotation of rectangular boxes and combine local search with global search.Therefore,tracking by natural language specification can bring more flexible,robust and accurate tracking performance in practical scenarios.In summary,this article reviews visual object tracking by natural language specification,outlines the key technologies of related principles and model improvements,and summarizes the advantages and disadvantages of different network structures.
分 类 号:TP399[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.224.52.33