Q-学习算法

作品数:27被引量:135H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:胡子婴张峰徐如燕张宇轩刘凯更多>>
相关机构:哈尔滨理工大学哈尔滨工业大学河北大学吉林大学更多>>
相关期刊:《西南交通大学学报》《上海交通大学学报》《电子技术应用》《北京理工大学学报》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划河北省教育厅青年基金中国博士后科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机研究与发展x
条 记 录,以下是1-2
视图:
排序:
基于偏向信息学习的双层强化学习算法被引量:9
《计算机研究与发展》2008年第9期1455-1462,共8页林芬 石川 罗杰文 史忠植 
国家“八六三”高技术研究发展计划基金项目(2007AA01Z132);国家“九七三”重点基础研究发展规划基金项目(2003CB317004);国家自然科学基金项目(60775035,90604017)~~
传统的强化学习存在收敛速度慢等问题,结合先验知识预置某些偏向可以加快学习速度.但是当先验知识不正确时又可能导致学习过程不收敛.对此,提出基于偏向信息学习的双层强化学习模型.该模型将强化学习过程和偏向信息学习过程结合起来:偏...
关键词:强化学习 Q-学习算法 偏向信息 偏向信息学习 先验知识 
基于Metropolis准则的Q-学习算法研究被引量:14
《计算机研究与发展》2002年第6期684-688,共5页郭茂祖 王亚东 刘 扬 孙华梅 
本课题得到国家"八六三"高技术研究发展计划(200lAA115550);国家自然科学基金(70071008);中国博士后科学基金资助
探索与扩张是Q-学习算法中动作选取的关键问题,一味地扩张将使智能体很快地陷入局部最优,虽然探索可以跳出局部最优并加速学习,而过多的探索将影响算法的性能.通过把Q-学习中寻求最优策略表示为组合优化问题中最优解的搜索,将模拟退火...
关键词:机器学习 METROPOLIS准则 Q-学习算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部