强化学习算法

作品数:313被引量:809H指数:13
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:俞扬周志华钱丽萍黄亮吴远更多>>
相关机构:东南大学北京邮电大学清华大学电子科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金国家重点基础研究发展计划国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=小型微型计算机系统x
条 记 录,以下是1-4
视图:
排序:
基于任务空间网格分割的强化学习算法
《小型微型计算机系统》2023年第12期2633-2639,共7页祖立鹏 王文学 
国家自然科学基金项目(61925307,61821005,91748212)资助。
强化学习中设计合理的奖励函数具有重要的意义,但这也是具有挑战性的,尤其是在实际机器人控制任务中.因此,能够在稀疏奖励的环境中探索有效的强化学习算法是当前持续关注的问题.目前虽然已经有许多在稀疏奖励下的强化学习算法研究,但从...
关键词:强化学习 模仿学习 空间网格分割 稀疏奖励函数 机械臂抓取 
融合时空特征的视觉自动驾驶强化学习算法被引量:1
《小型微型计算机系统》2023年第2期356-362,共7页杨蕾 雷为民 张伟 
中央高校基本科研业务专项资金项目(N2216010)资助;国家重点研发计划项目(2018YFB1702000)资助.
基于视觉的自动驾驶任务挑战主要来自环境信息维度高和训练数据分布偏差大2个方面.针对环境信息维度高的挑战,融合时空特征的视觉自动驾驶算法(Space-Time Reinforce Learning Auto Driving,简称STRLAD)使用双流网络络进行特征提取,包含...
关键词:深度强化学习 计算机视觉 自动驾驶 深度神经网络 人工智能 
移动机器人模糊Sarsa(λ)学习导航研究
《小型微型计算机系统》2013年第11期2599-2602,共4页陈卫东 关永贞 朱奇光 赵成龙 
教育部科学技术研究重点项目(211023)资助;河北省自然科学基金青年基金项目(F2012203169)资助;河北省高等学校自然科学青年基金项目(2011223)资助
针对复杂未知环境下难以获得完善的模糊导航控制规则以及传统的强化学习算法不能解决连续状态空间和连续动作空间的学习问题,提出了一种模糊强化学习算法.通过将模糊推理系统和强化学习算法相结合,设计了一种模糊强化学习系统,一方面,...
关键词:Sarsa(λ)学习 模糊强化学习算法 模糊推理系统 机器人导航 
混合多Agent环境下动态策略强化学习算法被引量:1
《小型微型计算机系统》2009年第7期1268-1273,共6页肖正 何青松 张世永 
国家重点基础研究发展"九七三"计划项目(2005CB321906)资助
机器学习在多Agent系统的协作和行为决策中得到广泛关注和深入研究.分析基于均衡解和最佳响应的学习算法,提出了两个混合多Agent环境下动态策略的强化学习算法.该算法不仅能适应系统中其他Agent的行为策略和变化,而且能利用过去的行为...
关键词:多AGENT系统 行为选择 动态策略 强化学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部