强化学习方法

作品数:126被引量:575H指数:13
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:程玉虎王雪松刘全李厚强周文罡更多>>
相关机构:清华大学中国科学技术大学南京大学浙江大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金江苏省自然科学基金江苏省高校自然科学研究项目中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与应用x
条 记 录,以下是1-3
视图:
排序:
结合元学习和安全区域探索的进化强化学习方法
《计算机工程与应用》2025年第1期361-367,共7页李晓益 胡滨 秦进 彭安浪 
贵州省科技计划项目([2020]1Y275);贵州省科技计划项目(黔科合支撑[2022]一般267);国家自然科学基金(62066006)。
最近提出的进化强化学习(evolutionary reinforcement learning,ERL)框架表明了利用进化算法提高强化学习的探索能力对性能提升的好处。然而,现有的基于ERL的方法并没有完全解决进化算法中突变的可伸缩性问题且由于进化算法本身的限制使...
关键词:进化强化学习 元学习 预训练 安全区域 突变算子 
基于强化学习方法的访存调度算法被引量:3
《计算机工程与应用》2018年第2期62-67,227,共7页邱东黎 施晶晶 
国家高技术研究发展计划(863)(No.2015AA01A301)
在现代处理器中,存储控制器是处理器芯片对片外存储器进行访问的管理者和执行者,其中对访存过程的调度算法会对实际访存性能产生十分重要的影响。针对已有调度算法在不同负载特征下自适应性不足的问题,提出了一种基于强化学习方法的ALH...
关键词:存储控制器 访存调度算法 自适应性 强化学习 
一种结合演示数据和演化优化的强化学习方法
《计算机工程与应用》2014年第11期115-119,129,共6页宋拴 俞扬 
江苏省自然科学基金青年项目(No.BK2012303)
强化学习研究智能体如何从与环境的交互中学习最优的策略,以最大化长期奖赏。由于环境反馈的滞后性,强化学习问题面临巨大的决策空间,进行有效的搜索是获得成功学习的关键。以往的研究从多个角度对策略的搜索进行了探索,在搜索算法方面...
关键词:强化学习 演化算法 从演示中学习 神经网络 
检索报告 对象比较 聚类工具 使用帮助 返回顶部