检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院自动化研究所,北京100190 [2]中国科学院大学,北京100049
出 处:《人工智能》2024年第6期41-49,共9页Artificial Intelligence View
基 金:国家自然科学基金(62033013)。
摘 要:近年来,水下仿生机器人的协同围捕研究受到了广泛的关注。然而,由于水下环境的复杂性和多变性,以及这类仿生机器人的特殊运动模式,导致该研究面临着众多的技术难题。针对这些难题,本文提出了一种基于多智能体强化学习的水下仿生机器人协同围捕策略,完成了相关实验验证。具体而言,本文设计了一个基于多智能体深度确定性策略梯度网络的围捕策略训练框架,针对水下围捕任务的需求,设计了相应的奖励函数,提升了围捕策略的训练效果。考虑到水下仿生机器人在运动和控制上的特点,本文制定了相应的状态转换规则,从而使策略能够很好地迁移到实际应用中。经过一系列实验测试表明,所提出的策略能够显著提高水下协同围捕任务的成功率及稳定性。本研究有效提高了水下仿生机器人集群协同围捕任务的效率和能力,为水下仿生机器人集群的协同控制提供了重要的理论基础和技术支撑。
分 类 号:TP249[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.43