一种改进的视频分割网络及其全局信息优化方法  被引量:2

An Improved Video Segmentation Network and Its Global Information Optimization Method

在线阅读下载全文

作  者:张琳 陆耀[1,2] 卢丽华 周天飞 史青宣 ZHANG Lin;LU Yao;LU Li-Hua;ZHOU Tian-Fei;SHI Qing-Xuan(School of Computer Science and Technology,Beijing Institute of Technology,Beijing 100081;Beijing Laboratory of Intelligent Information Technology,Beijing 100081;The Institute of North Electronic Equipment,Beijing 100083;School of Cyber Security and Computer,Hebei University,Baoding 071000)

机构地区:[1]北京理工大学计算机学院,北京100081 [2]智能信息技术北京市重点实验室,北京100081 [3]北方电子设备研究所,北京100083 [4]河北大学网络空间安全与计算机学院,保定071000

出  处:《自动化学报》2022年第3期787-796,共10页Acta Automatica Sinica

基  金:国家自然科学基金(61273273);国家重点研发计划(2017YFC0112001)资助。

摘  要:提出了一种基于注意力机制的视频分割网络及其全局信息优化训练方法.该方法包含一个改进的视频分割网络,在对视频中的物体进行分割后,利用初步分割的结果作为先验信息对网络优化,再次分割得到最终结果.该分割网络是一种双流卷积网络,以视频图像和光流图像作为输入,分别提取图像的表观信息和运动信息,最终融合得到分割掩膜(Segmentation mask).网络中嵌入了一个新的卷积注意力模块,应用于卷积网络的高层次特征与相邻低层次特征之间,使得高层语义特征可以定位低层特征中的重要区域,提高网络的收敛速度和分割准确度.在初步分割之后,本方法提出利用初步结果作为监督信息对表观网络的权值进行微调,使其辨识前景物体的特征,进一步提高双流网络的分割效果.在公开数据集DAVIS上的实验结果表明,该方法可准确地分割出视频中时空显著的物体,效果优于同类双流分割方法.对注意力模块的对比分析实验表明,该注意力模块可以极大地提高分割网络的效果,较本方法的基准方法(Baseline)有很大的提高.This paper presents an attention-based video segmentation network and its global information optimization training method.We propose an improved segmentation network,and use it to compute initial segmentation masks.Then the initial masks are considered as priors to finetune the network.Finally,the network with the learnt weight generates fine masks.Our two-stream segmentation network includes appearance branch and motion branch.Fed with image and optical flow image separately,the network extracts appearance features and motion features to generate segmentation mask.An attention module is embedded in the network,between the adjacent high level feature and low level feature.Thus the high level features locate the semantic region for the low level feature,speeding up the network convergence and improving segmentation quality.We propose to optimize the initial masks to finetune the original appearance network weights,making the network recognize the object and improving the network performance.Experiments on DAVIS show the effectiveness of the segmentation framework.Our method outperforms the traditional two-stream segmentation algorithms,and achieves comparable results with algorithms on the dataset’s leaderboard.Validation experiment illustrates our attention module greatly improves the network performance than the baseline.

关 键 词:视频物体分割 卷积神经网络 注意力机制 全局信息优化 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象