分层强化学习

作品数:89被引量:329H指数:10
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:沈晶刘海波顾国昌刘全彭志平更多>>
相关机构:哈尔滨工程大学苏州大学北京邮电大学东南大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金江苏省自然科学基金广东省自然科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于分层强化学习的多无人机协同围捕方法
《控制理论与应用》2025年第1期96-108,共13页孙懿豪 闫超 相晓嘉 唐邓清 周晗 姜杰 
国家自然科学基金项目(62403240);江苏省自然科学基金项目(BK20241396);湖南省研究生科研创新项目(CX20240114)资助.
针对复杂障碍环境下的动态目标围捕问题,本文提出一种基于分层强化学习的多无人机协同围捕方法.该方法包含两个层级的学习过程:底层的子策略学习和高层的子策略切换.具体而言,将协同围捕任务分解为导航避障和导航避碰两个子任务,独立学...
关键词:分层强化学习 避障 避碰 多无人机围捕 
融合Bi-LSTM与多头注意力的分层强化学习推理方法
《计算机应用研究》2025年第1期71-77,共7页李卫军 刘世侠 刘雪洋 丁建平 苏易礌 王子怡 
宁夏高等学校科学研究项目(NYG2024086);宁夏自然科学基金资助项目(2021AAC03215);中央高校科研资助项目(2022PT_S04,2021JCYJ12);国家自然科学基金资助项目(62066038,61962001)。
知识推理作为知识图谱补全中一项重要任务,受到了学术界的广泛关注。针对知识推理可解释性差、不能利用隐藏语义信息和奖励稀疏的问题提出了一种融合Bi-LSTM与多头注意力机制的分层强化学习方法。将知识图谱通过谱聚类分簇,使智能体分...
关键词:知识推理 分层强化学习 Bi-LSTM 多头注意力机制 
基于符号知识的选项发现方法
《计算机科学》2025年第1期277-288,共12页王麒迪 沈立炜 吴天一 
上海市重大项目(2021SHZDZX0103)。
基于选项(Option)的层次化策略学习是分层强化学习领域的一种主要实现方式。其中,选项表示特定动作的时序抽象,一组选项以多层次组合的方式可解决复杂的强化学习任务。针对选项发现这一目标,已有的研究工作使用监督或无监督方式从非结...
关键词:分层强化学习 演示学习 选项发现 马尔可夫决策过程 
基于分层强化学习的矿区无人驾驶车辆路径规划算法被引量:1
《金属矿山》2024年第11期192-198,共7页魏晓娟 李纪云 巩闯 
2022年度河南省重点研发与推广专项(科技攻关)项目(编号:222102240049);2022年度河南职业技术学院校级科研项目(编号:2022ZK35)。
在复杂而危险的矿区环境中,矿区无人驾驶车辆的路径规划涉及如何使车辆智能地选择最佳路径,以实现安全和高效运行。然而,传统的路径规划算法难以有效应对矿区内多变的路况和环境。提出了一种基于分层强化学习的矿区无人驾驶车辆路径规...
关键词:矿区无人驾驶车辆 分层强化学习 路径规划 图指针网络 
基于混合动作的空战分层强化学习决策算法被引量:1
《航空学报》2024年第17期156-173,共18页李佐龙 朱纪洪 匡敏驰 张杰 任洁 
智能空战是世界主要军事强国的研究热点。为解决超视距空战博弈机动决策问题,提出了基于深度强化学习的超视距空战分层决策算法。在该决策算法中,使用适合于超视距空战的机动动作集,对飞机的航迹和姿态进行控制。为了扩大模型的动作空间...
关键词:超视距空战 智能决策 深度强化学习 近端策略优化 机动动作 分层决策 
基于近似动态规划的多级火箭全程任务决策
《宇航学报》2024年第8期1251-1260,共10页李超兵 包为民 李忠奎 禹春梅 程晓明 
国家自然科学基金(U21B2028)。
针对火箭发生推力下降故障下的任务决策问题,提出了一种基于近似动态规划的多级火箭全程任务决策方法。首先,通过设置初始状态集合、决策选项、奖励函数、Q函数迭代方法等,建立了火箭任务决策分层强化学习模型,得到对火箭后续飞行进行...
关键词:运载火箭 推力故障 任务决策 近似动态规划 分层强化学习 
基于分层强化学习的多智能体博弈策略生成方法
《无线电工程》2024年第6期1361-1367,共7页畅鑫 李艳斌 刘东辉 
中国博士后科学基金(2021 M693002);国家自然科学基金(71991485,71991481,71991480)。
典型基于深度强化学习的多智能体对抗策略生成方法采用“分总”框架,各智能体基于部分可观测信息生成策略并进行决策,缺乏从整体角度生成对抗策略的能力,大大限制了决策能力。为了解决该问题,基于分层强化学习提出改进的多智能体博弈策...
关键词:分层强化学习 多智能体博弈 深度神经网络 
基于启发式奖赏塑形方法的智能化攻击路径发现
《信息安全学报》2024年第3期44-58,共15页曾庆伟 张国敏 邢长友 宋丽华 
国家自然科学基金(No.62172432)资助。
渗透测试作为一种评估网络系统安全性能的重要手段,是以攻击者的角度模拟真实的网络攻击,找出网络系统中的脆弱点。而自动化渗透测试则是利用各种智能化方法实现渗透测试过程的自动化,从而大幅降低渗透测试的成本。攻击路径发现作为自...
关键词:自动化渗透测试 奖赏塑形 分层强化学习 攻击路径发现 DQN算法 
基于强化学习的离场飞行程序航迹生成方法
《计算机应用》2024年第S01期355-362,共8页宋歌 韩鹏飞 罗钰翔 
民航局安全能力建设项目(MHAQ2022008,MHAQ2022004)。
现代飞行程序设计受地形、障碍物、空域和飞行性能等多种因素的影响,设计过程中需进行大量针对设计细节有效性的评估工作;设计完毕的飞行程序还需专业的飞行试飞人员进行模拟机和真机试飞,耗费大量的人力、经济成本。如果试飞前缺少针...
关键词:现代飞行程序设计 深度强化学习 航迹生成 分层强化学习 多维度动态时间规整 
基于脉冲神经网络的指挥智能体技术
《火力与指挥控制》2024年第5期36-43,51,共9页王栋 赵彦东 陈希飞 
针对现有智能体技术应用于军事指挥控制领域中时存在计算资源需求高、奖励值稀疏、收敛速度慢、推理效果差的问题,提出了一种基于脉冲神经网络(spiking neural network,SNN)和分层强化学习的指挥智能体技术。基于分层强化学习思想对军...
关键词:脉冲神经网络 分层强化学习 指挥智能体 ANN-SNN 
检索报告 对象比较 聚类工具 使用帮助 返回顶部