基于多智能体强化学习的水下仿生机器人协同围捕  

在线阅读下载全文

作  者:冯育凯 吴正兴[1,2] 余涟祎 谭民 

机构地区:[1]中国科学院自动化研究所,北京100190 [2]中国科学院大学,北京100049

出  处:《人工智能》2024年第6期41-49,共9页Artificial Intelligence View

基  金:国家自然科学基金(62033013)。

摘  要:近年来,水下仿生机器人的协同围捕研究受到了广泛的关注。然而,由于水下环境的复杂性和多变性,以及这类仿生机器人的特殊运动模式,导致该研究面临着众多的技术难题。针对这些难题,本文提出了一种基于多智能体强化学习的水下仿生机器人协同围捕策略,完成了相关实验验证。具体而言,本文设计了一个基于多智能体深度确定性策略梯度网络的围捕策略训练框架,针对水下围捕任务的需求,设计了相应的奖励函数,提升了围捕策略的训练效果。考虑到水下仿生机器人在运动和控制上的特点,本文制定了相应的状态转换规则,从而使策略能够很好地迁移到实际应用中。经过一系列实验测试表明,所提出的策略能够显著提高水下协同围捕任务的成功率及稳定性。本研究有效提高了水下仿生机器人集群协同围捕任务的效率和能力,为水下仿生机器人集群的协同控制提供了重要的理论基础和技术支撑。

关 键 词:水下仿生机器人 多机器人系统 多智能体强化学习 

分 类 号:TP249[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象