检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:胡晓东 张宽[1] 谢圆[1] 张辉 卢皓 刘传凯[1] 陈翔 赵焕洲 谢剑锋[1] HU Xiaodong;ZHANG Kuan;XIE Yuan;ZHANG Hui;LU Hao;LIU Chuankai;CHEN Xiang;ZHAO Huanzhou;XIE Jianfeng(Beijing Aerospace Control Center,Beijing 100094,China)
出 处:《深空探测学报(中英文)》2021年第6期564-571,共8页Journal Of Deep Space Exploration
基 金:国家自然科学基金青年科学基金资助项目(62003025);国家自然科学基金资助项目(61972020)。
摘 要:针对“嫦娥五号”月面采样任务中采样机械臂的精准控制问题,提出了一种基于深度强化学习的路径规划方法。通过设计深度强化学习算法的多约束奖赏函数,规划了满足安全性、快速性、可达性3个约束的运动路径,实现了采样机械臂的精准控制。在满足任务安全性的提前下,缩短了天地之间的交互时间,机械臂控制效果平稳。在轨实验结果表明,该方法具有较高的准确性和鲁棒性,可为后续的深空探测在轨遥操作采样任务提供借鉴。Aiming at the problem of precise control of the sampling manipulator in the lunar surface sampling mission of"Chang'E-5",a path planning method based on deep reinforcement learning is proposed.By designing the multi-constraint reward function of the deep reinforcement learning algorithm,a motion path that satisfies the three constraints of safety,speed and reachability is planned.The precise control of the sampling robotic arm is realized.Under the advance of meeting the task safety,the interaction time between heaven and earth is greatly shortened,and the control effect of the manipulator is more stable.Experimental results show that this method has high accuracy and robustness,and can provide reference for subsequent on orbit sampling tasks.
分 类 号:V525[航空宇航科学与技术—人机与环境工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117