检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:贾瑞明[1] 李彤 李阳 王一丁[1] Jia Ruiming;Li Tong;Li Yang;Wang Yiding(School of Information Science&Technology,North China University of Technology,Beijing 100144,China)
出 处:《计算机应用研究》2021年第1期293-297,共5页Application Research of Computers
基 金:国家自然科学基金面上项目(61673021);北方工业大学学生科技活动资助项目。
摘 要:针对单目深度估计网络庞大的参数量和计算量,提出一种轻量金字塔解码结构的单目深度估计网络,可以在保证估计精度的情况下降低网络模型的复杂度、减少运算时间。该网络基于编解码结构,以端到端的方式估计单目图像的深度图。编码端使用ResNet50网络结构;在解码端提出了一种轻量金字塔解码模块,采用深度空洞可分离卷积和分组卷积以提升感受野范围,同时减少了参数量,并且采用金字塔结构融合不同感受野下的特征图以提升解码模块的性能;此外,在解码模块之间增加跳跃连接实现知识共享,以提升网络的估计精度。在NYUD v2数据集上的实验结果表明,与结构注意力引导网络相比,轻量金字塔解码结构的单目深度估计网络在误差RMS的指标上降低约11.0%,计算效率提升约84.6%。This paper proposed a light-weight pyramid decoder convolution neural network(LPDNet)for monocular depth estimation,which could reduce the complexity and the computation time of the network model while ensuring the estimation accuracy.LPDNet was based on encoder-decoder structure to estimate the depth map of a monocular image in an end-to-end manner.The encoder network adopted ResNet50.The main part of decoder network was light-weight pyramid decoder(LPD)module,which learned representations from a large receptive field with fewer parameters by using depth-wise dilated separable convolutions and group convolutions.LPD module fused feature maps of different receptive fields through pyramid structure.Besides,in order to perform better knowledge sharing for estimation accuracy,it added deconvolution skip connection between adjacent decoder modules.Experiments on NYUD v2 dataset demonstrate that compared with the structured attention guided network in CVPR2018,the error of LPDNet is reduced by about 11.0%in RMS,and computational efficiency is about 84.6%higher.
关 键 词:单目深度估计 卷积神经网络 编解码结构 轻量金字塔解码
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13