SPEEDY

作品数:39被引量:20H指数:3
导出分析报告
相关领域:经济管理更多>>
相关作者:罗飞顾春华李媛媛闫丽李媛媛更多>>
相关机构:华东理工大学中国医学科学院北京协和医学院国家卫生计生委科学技术研究所中国科学院大学更多>>
相关期刊:《Chinese Medical Journal》《China's Foreign Trade》《Neuroimmunology and Neuroinflammation》《自动化与仪器仪表》更多>>
相关基金:国家自然科学基金中央级公益性科研院所基本科研业务费专项上海汽车工业科技发展基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机科学x
条 记 录,以下是1-2
视图:
排序:
基于逐次超松弛技术的Double Speedy Q-Learning算法被引量:1
《计算机科学》2022年第3期239-245,共7页周琴 罗飞 丁炜超 顾春华 郑帅 
国家自然科学基金(61472139);上海汽车工业科技发展基金会产学研课题(1915)。
Q-Learning是目前一种主流的强化学习算法,但其在随机环境中收敛速度不佳,之前的研究针对Speedy Q-Learning存在的过估计问题进行改进,提出了Double Speedy Q-Learning算法。但Double Speedy Q-Learning算法并未考虑随机环境中存在的自...
关键词:强化学习 Q-LEARNING 马尔可夫决策过程 逐次超松弛迭代法 自循环结构 
基于双估计器的改进Speedy Q-learning算法被引量:6
《计算机科学》2020年第7期179-185,共7页郑帅 罗飞 顾春华 丁炜超 卢海峰 
国家自然科学基金(61472139);华东理工大学2017年教育教学规律与方法研究项目(ZH1726107)。
Q-learning算法是一种经典的强化学习算法,更新策略由于保守和过估计的原因,存在收敛速度慢的问题。Speedy Q-learning算法和Double Q-learning算法是Q-learning算法的两个变种,分别用于解决Q-learning算法收敛速度慢和过估计的问题。...
关键词:Q-LEARNING Double Q-learning Speedy Q-learning 强化学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部