强化学习方法

作品数:126被引量:575H指数:13
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:程玉虎王雪松刘全李厚强周文罡更多>>
相关机构:清华大学中国科学技术大学南京大学浙江大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金江苏省自然科学基金江苏省高校自然科学研究项目中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=控制与决策x
条 记 录,以下是1-3
视图:
排序:
移动机器人运动规划中的深度强化学习方法被引量:31
《控制与决策》2021年第6期1281-1292,共12页孙辉辉 胡春鹤 张军国 
国家自然科学基金青年科学基金项目(61703047);中央高校基本科研业务费专项资金项目(2016ZCQ08)。
随着移动机器人作业环境复杂度的提高、随机性的增强、信息量的减少,移动机器人的运动规划能力受到了严峻的挑战.研究移动机器人高效自主的运动规划理论与方法,使其在长期任务中始终保持良好的复杂环境适应能力,对保障工作安全和提升任...
关键词:移动机器人 运动规划 强化学习 深度强化学习 
基于重抽样优选缓存经验回放机制的深度强化学习方法被引量:25
《控制与决策》2018年第4期600-606,共7页陈希亮 曹雷 李晨溪 徐志雄 何明 
国家自然科学基金项目(61301159;61303267);国家重点研发计划项目(2016YFC0800606);江苏省自然科学基金项目(BK20150721;BK20161469)
针对深度强化学习算法中经验缓存机制构建问题,提出一种基于TD误差的重抽样优选缓存机制;针对该机制存在的训练集坍塌现象,提出基于排行的分层抽样算法进行改进,并结合该机制对已有的几种典型基于DQN的深度强化学习算法进行改进.通过对O...
关键词:深度强化学习 缓存回放 重抽样 
连续状态自适应离散化基于K-均值聚类的强化学习方法被引量:7
《控制与决策》2006年第2期143-147,共5页文锋 陈宗海 卓睿 周光明 
国家自然科学基金项目(60575033);国家高水平大学985计划项目(KY2701)
使用聚类算法对连续状态空间进行自适应离散化,得到了基于K-均值聚类的强化学习方法.该方法的学习过程分为两部分:对连续状态空间进行自适应离散化的状态空间学习,使用K-均值聚类算法;寻找最优策略的策略学习,使用替代合适迹Sarsa学习算...
关键词:强化学习 K-均值聚类算法 Sarsa学习 连续状态 自适应离散化 
检索报告 对象比较 聚类工具 使用帮助 返回顶部