检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:黄兆军[1]
出 处:《机器人技术与应用》2024年第5期23-29,共7页Robot Technique and Application
基 金:2023年度广东省普通高校特色创新项目“海水养殖专用低成本小型便携式巡检ROV关键技术的研究与实现”(2023KTSCX330);珠海城市职业技术学院2022年度重点科研项目“一种低成本小型便携式海水养殖专用水下机器人的研发”(KY2022Z02Z)。
摘 要:本文首先介绍了强化学习在无人遥控水下机器人(ROV)运动控制方面的研究现状,指出目前阻碍其进一步应用的共性难题,并对深度强化学习算法中的深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法的基本原理进行了阐述;然后针对DDPG算法应用于ROV运动控制时所存在的坏样本影响学习稳定性和缺少环境探索能力的问题,从神经网络结构和噪声引入两个方面对该算法进行了改进,提出了基于均值策略的混合式神经网络结构和引入参数空间噪声的方法;最后进行仿真实验,实验结果证明:本文改进型DDPG算法比常规的DDPG算法和传统的PID控制算法更加有效。
关 键 词:小型ROV 强化学习 深度确定性策略梯度 混合式神经网络 参数噪声 运动控制
分 类 号:TP242.3[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49