检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:贾瑞明[1] 刘圣杰 李锦涛 王赟豪 潘海侠[2] JIA Ruiming;LIU Shengjie;LI Jintao;WANG Yunhao;PAN Haixia(School of Information Science and Technology,North China University of Technology,Beijing 100144,China;College of Software,Beihang University,Bejing 100083,China)
机构地区:[1]北方工业大学信息学院,北京100144 [2]北京航空航天大学软件学院,北京100083
出 处:《北京航空航天大学学报》2019年第10期1965-1972,共8页Journal of Beijing University of Aeronautics and Astronautics
基 金:国家重点研发计划(2017YFB0802300);北京市教委面上项目(KM201510009005);北方工业大学学生科技活动项目(110051360007)~~
摘 要:为了从单张RGB图像估计出相机的位姿信息,提出了一种深度编解码双路卷积神经网络(CNN),提升了视觉自定位的精度。首先,使用编码器从输入图像中提取高维特征;然后,使用解码器提升特征的空间分辨率;最后,通过多尺度位姿预测器输出位姿参数。由于位置和姿态的特性不同,网络从解码器开始采用双路结构,对位置和姿态分别进行处理,并且在编解码之间增加跳跃连接以保持空间信息。实验结果表明:所提网络的精度与目前同类型算法相比有明显提升,其中相机姿态角度精度有较大提升。In order to calculate the camera pose from a single RGB image,a deep encoder-decoder dualstream convolutional neural network( CNN) is proposed,which can improve the accuracy of visual localization. The network first uses an encoder to extract advanced features from input images. Second,the spacialresolution is enhancedby a pose decoder. Finally,a multi-scale estimator is used to output pose parameters.Becauseof the differentperformance of position and orientation,the network adopts a dual-stream structure from the decoder to process the position and orientationseparately. To restore the spatial information,several skip connections are added to encoder-decoder architecture. The experimental results show that the accuracy of the network is obviously improved compared with the congener state-of-the-art algorithms,and the orientation accuracy of camera pose is improved dramatically.
关 键 词:视觉自定位 编解码结构 卷积神经网络(CNN) 跳跃连接 双路网络
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222