基于多智能体强化学习的水下仿生机器人协同围捕

机构地区：[1]中国科学院自动化研究所,北京100190 [2]中国科学院大学,北京100049

出　　处：《人工智能》2024年第6期41-49,共9页Artificial Intelligence View

基　　金：国家自然科学基金(62033013)。

摘　　要：近年来,水下仿生机器人的协同围捕研究受到了广泛的关注。然而,由于水下环境的复杂性和多变性,以及这类仿生机器人的特殊运动模式,导致该研究面临着众多的技术难题。针对这些难题,本文提出了一种基于多智能体强化学习的水下仿生机器人协同围捕策略,完成了相关实验验证。具体而言,本文设计了一个基于多智能体深度确定性策略梯度网络的围捕策略训练框架,针对水下围捕任务的需求,设计了相应的奖励函数,提升了围捕策略的训练效果。考虑到水下仿生机器人在运动和控制上的特点,本文制定了相应的状态转换规则,从而使策略能够很好地迁移到实际应用中。经过一系列实验测试表明,所提出的策略能够显著提高水下协同围捕任务的成功率及稳定性。本研究有效提高了水下仿生机器人集群协同围捕任务的效率和能力,为水下仿生机器人集群的协同控制提供了重要的理论基础和技术支撑。

关键词：水下仿生机器人多机器人系统多智能体强化学习

分类号：TP249[自动化与计算机技术—检测技术与自动化装置]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于多智能体强化学习的水下仿生机器人协同围捕

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于多智能体强化学习的水下仿生机器人协同围捕

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索