多层级特征融合结构的单目图像深度估计网络  被引量:7

Monocular Image Depth Estimation Network with Multiple Level Feature Fusion Structure

在线阅读下载全文

作  者:贾瑞明[1] 李阳 李彤 崔家礼[1] 王一丁[1] JIA Ruiming;LI Yang;LI Tong;CUI Jiali;WANG Yiding(School of Information Science and Technology,North China University of Technology,Beijing 100144,China)

机构地区:[1]北方工业大学信息学院,北京100144

出  处:《计算机工程》2020年第12期207-214,共8页Computer Engineering

基  金:国家自然科学基金面上项目(61673021);北方工业大学学生科技活动项目(110051360019XN140)。

摘  要:采用卷积神经网络对单目图像的深度进行估计时,存在深度信息不精确、边缘模糊以及细节缺失等问题。为此,提出一种多层级特征融合结构的深度卷积网络。该网络采用端到端的编-解码器结构,编码器使用ResNet101网络结构将图像转换为高维特征图,解码器使用上采样卷积模块从高维特征图中重建出深度图像,并对编码器与解码器中的不同层级特征进行融合。基于NYUv2数据集与KITTI数据集的实验结果表明,相比其他先进网络,该网络不仅能预测出更加准确的深度信息,而且能保持预测深度图像的边缘信息。The monocular image depth estimation based on Convolutional Neural Network(CNN)is faced with inaccurate depth information,fuzzy edge and missing details.Therefore,this paper proposes a deep convolutional network with multiple level feature fusion structure.The network adopts the end-to-end encoder and decoder structure.The encoder uses ResNet101 network structure to convert the image into a high-dimensional feature map.The decoder uses an up-sampling convolution module to reconstruct a depth image from the high-dimensional feature map,and fuses the features of different levels in the encoder and decoder.The experimental results on the NYUv2 dataset and KITTI dataset show that compared with other advanced networks,the network can not only predict more accurate depth information,but also keep the edge information of the predicted depth image.

关 键 词:单目图像 深度估计 编-解码器结构 多层级融合 亚像素卷积 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象