检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:董经纬 姚尧 冯景祥 李亚哲 尤岳 DONG Jingwei;YAO Yao;FENG Jingxiang;LI Yazhe;YOU Yue(The 716 Research Institute of CSSC,Lianyungang 222061,China;No.92578 Unit of PLA,Beijing 100071,China)
机构地区:[1]中国船舶集团有限公司第七一六研究所,江苏连云港222061 [2]中国人民解放军92578部队,北京100071
出 处:《舰船科学技术》2024年第12期84-89,共6页Ship Science and Technology
基 金:中国科协青年人才托举工程项目(2020-JCJQ-QT-013)。
摘 要:无人水下航行器(Unmanned Underwater Vehicle,UUV)集群的任务分配问题是UUV集群形成水下功能的重要问题之一,但是,受限于通信以及探测能力,UUV在水下只能获取有限的信息,不能得到很好的应用。提出一种基于深度强化学习的任务分配算法,针对水下信息缺失、奖励稀少的问题,在近端策略优化算法的基础上加入Curiosity模块,给智能体一种减小环境中不确定性的期望,鼓励UUV探索环境中不可预测的部分,实现UUV集群的最优任务分配。最后的仿真实验表明,相较于传统智能算法,该方法收敛更快,可靠性更强。The Assignment problem problem of the UUV cluster is one of the important problems for the formation of the underwater function of the UUV cluster.However,due to the communication and detection capabilities,UUV can only obtain limited information underwater and cannot be used well.A task allocation algorithm based on deep reinforcement learning is proposed.Aiming at the problem of lack of underwater information and scarce rewards,the Curiosity module is added on the basis of the near end strategy optimization algorithm,giving agents an expectation to reduce the uncertainty in the environment,encouraging UUV to explore the unpredictable part of the environment,and realizing the optimal task alloc-ation of UUV clusters.The final simulation experiment shows that compared to traditional intelligent algorithms,it con-verges faster and has stronger reliability.
分 类 号:U661[交通运输工程—船舶及航道工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.191.244.172