云南高校图书馆联盟文献共享服务平台- 强化学习方法

强化学习方法: 作品数：126被引量：575H指数：13; 导出分析报告; 相关领域：自动化与计算机技术更多>>; 相关作者：程玉虎王雪松刘全李厚强周文罡更多>>; 相关机构：清华大学中国科学技术大学南京大学浙江大学更多>>; 相关期刊：更多>>; 相关基金：国家自然科学基金江苏省自然科学基金江苏省高校自然科学研究项目中央高校基本科研业务费专项资金更多>>

-

在结果中检索

检索结果分析

结果分析中...

选择条件：

期刊=计算机工程与应用

共条记录，以下是1-3

全选清除导出

参考文献引证文献引用追踪

视图：

排序：

结合元学习和安全区域探索的进化强化学习方法: 《计算机工程与应用》2025年第1期361-367,共7页李晓益胡滨秦进彭安浪; 贵州省科技计划项目([2020]1Y275);贵州省科技计划项目(黔科合支撑[2022]一般267);国家自然科学基金(62066006)。; 最近提出的进化强化学习(evolutionary reinforcement learning,ERL)框架表明了利用进化算法提高强化学习的探索能力对性能提升的好处。然而,现有的基于ERL的方法并没有完全解决进化算法中突变的可伸缩性问题且由于进化算法本身的限制使...; 关键词：进化强化学习元学习预训练安全区域突变算子

基于强化学习方法的访存调度算法被引量：3: 《计算机工程与应用》2018年第2期62-67,227,共7页邱东黎施晶晶; 国家高技术研究发展计划(863)(No.2015AA01A301); 在现代处理器中,存储控制器是处理器芯片对片外存储器进行访问的管理者和执行者,其中对访存过程的调度算法会对实际访存性能产生十分重要的影响。针对已有调度算法在不同负载特征下自适应性不足的问题,提出了一种基于强化学习方法的ALH...; 关键词：存储控制器访存调度算法自适应性强化学习

一种结合演示数据和演化优化的强化学习方法: 《计算机工程与应用》2014年第11期115-119,129,共6页宋拴俞扬; 江苏省自然科学基金青年项目(No.BK2012303); 强化学习研究智能体如何从与环境的交互中学习最优的策略,以最大化长期奖赏。由于环境反馈的滞后性,强化学习问题面临巨大的决策空间,进行有效的搜索是获得成功学习的关键。以往的研究从多个角度对策略的搜索进行了探索,在搜索算法方面...; 关键词：强化学习演化算法从演示中学习神经网络

全选清除导出

共1页<1>

检索报告对象比较聚类工具使用帮助返回顶部