云南高校图书馆联盟文献共享服务平台- SPEEDY

SPEEDY: 作品数：39被引量：20H指数：3; 导出分析报告; 相关领域：经济管理更多>>; 相关作者：罗飞顾春华李媛媛闫丽李媛媛更多>>; 相关机构：华东理工大学中国医学科学院北京协和医学院国家卫生计生委科学技术研究所中国科学院大学更多>>; 相关期刊：《Chinese Medical Journal》《China's Foreign Trade》《Neuroimmunology and Neuroinflammation》《自动化与仪器仪表》更多>>; 相关基金：国家自然科学基金中央级公益性科研院所基本科研业务费专项上海汽车工业科技发展基金更多>>

-

在结果中检索

检索结果分析

结果分析中...

选择条件：

期刊=计算机科学

共条记录，以下是1-2

全选清除导出

参考文献引证文献引用追踪

视图：

排序：

基于逐次超松弛技术的Double Speedy Q-Learning算法被引量：1: 《计算机科学》2022年第3期239-245,共7页周琴罗飞丁炜超顾春华郑帅; 国家自然科学基金(61472139);上海汽车工业科技发展基金会产学研课题(1915)。; Q-Learning是目前一种主流的强化学习算法,但其在随机环境中收敛速度不佳,之前的研究针对Speedy Q-Learning存在的过估计问题进行改进,提出了Double Speedy Q-Learning算法。但Double Speedy Q-Learning算法并未考虑随机环境中存在的自...; 关键词：强化学习 Q-LEARNING 马尔可夫决策过程逐次超松弛迭代法自循环结构

基于双估计器的改进Speedy Q-learning算法被引量：6: 《计算机科学》2020年第7期179-185,共7页郑帅罗飞顾春华丁炜超卢海峰; 国家自然科学基金(61472139);华东理工大学2017年教育教学规律与方法研究项目(ZH1726107)。; Q-learning算法是一种经典的强化学习算法,更新策略由于保守和过估计的原因,存在收敛速度慢的问题。Speedy Q-learning算法和Double Q-learning算法是Q-learning算法的两个变种,分别用于解决Q-learning算法收敛速度慢和过估计的问题。...; 关键词：Q-LEARNING Double Q-learning Speedy Q-learning 强化学习

全选清除导出

共1页<1>

检索报告对象比较聚类工具使用帮助返回顶部