云南高校图书馆联盟文献共享服务平台- 强化学习算法

强化学习算法: 作品数：313被引量：809H指数：13; 导出分析报告; 相关领域：自动化与计算机技术更多>>; 相关作者：俞扬周志华钱丽萍黄亮吴远更多>>; 相关机构：东南大学北京邮电大学清华大学电子科技大学更多>>; 相关期刊：更多>>; 相关基金：国家自然科学基金中央高校基本科研业务费专项资金国家重点基础研究发展计划国家高技术研究发展计划更多>>

-

在结果中检索

检索结果分析

结果分析中...

选择条件：

期刊=小型微型计算机系统

共条记录，以下是1-4

全选清除导出

参考文献引证文献引用追踪

视图：

排序：

基于任务空间网格分割的强化学习算法: 《小型微型计算机系统》2023年第12期2633-2639,共7页祖立鹏王文学; 国家自然科学基金项目(61925307,61821005,91748212)资助。; 强化学习中设计合理的奖励函数具有重要的意义,但这也是具有挑战性的,尤其是在实际机器人控制任务中.因此,能够在稀疏奖励的环境中探索有效的强化学习算法是当前持续关注的问题.目前虽然已经有许多在稀疏奖励下的强化学习算法研究,但从...; 关键词：强化学习模仿学习空间网格分割稀疏奖励函数机械臂抓取

融合时空特征的视觉自动驾驶强化学习算法被引量：1: 《小型微型计算机系统》2023年第2期356-362,共7页杨蕾雷为民张伟; 中央高校基本科研业务专项资金项目(N2216010)资助;国家重点研发计划项目(2018YFB1702000)资助.; 基于视觉的自动驾驶任务挑战主要来自环境信息维度高和训练数据分布偏差大2个方面.针对环境信息维度高的挑战,融合时空特征的视觉自动驾驶算法(Space-Time Reinforce Learning Auto Driving,简称STRLAD)使用双流网络络进行特征提取,包含...; 关键词：深度强化学习计算机视觉自动驾驶深度神经网络人工智能

移动机器人模糊Sarsa(λ)学习导航研究: 《小型微型计算机系统》2013年第11期2599-2602,共4页陈卫东关永贞朱奇光赵成龙; 教育部科学技术研究重点项目(211023)资助;河北省自然科学基金青年基金项目(F2012203169)资助;河北省高等学校自然科学青年基金项目(2011223)资助; 针对复杂未知环境下难以获得完善的模糊导航控制规则以及传统的强化学习算法不能解决连续状态空间和连续动作空间的学习问题,提出了一种模糊强化学习算法.通过将模糊推理系统和强化学习算法相结合,设计了一种模糊强化学习系统,一方面,...; 关键词：Sarsa(λ)学习模糊强化学习算法模糊推理系统机器人导航

混合多Agent环境下动态策略强化学习算法被引量：1: 《小型微型计算机系统》2009年第7期1268-1273,共6页肖正何青松张世永; 国家重点基础研究发展"九七三"计划项目(2005CB321906)资助; 机器学习在多Agent系统的协作和行为决策中得到广泛关注和深入研究.分析基于均衡解和最佳响应的学习算法,提出了两个混合多Agent环境下动态策略的强化学习算法.该算法不仅能适应系统中其他Agent的行为策略和变化,而且能利用过去的行为...; 关键词：多AGENT系统行为选择动态策略强化学习

全选清除导出

共1页<1>

检索报告对象比较聚类工具使用帮助返回顶部