云南高校图书馆联盟文献共享服务平台- Q-学习算法

Q-学习算法: 作品数：27被引量：135H指数：7; 导出分析报告; 相关领域：自动化与计算机技术更多>>; 相关作者：胡子婴张峰徐如燕张宇轩刘凯更多>>; 相关机构：哈尔滨理工大学哈尔滨工业大学河北大学吉林大学更多>>; 相关期刊：《西南交通大学学报》《上海交通大学学报》《电子技术应用》《北京理工大学学报》更多>>; 相关基金：国家自然科学基金国家高技术研究发展计划河北省教育厅青年基金中国博士后科学基金更多>>

-

在结果中检索

检索结果分析

结果分析中...

选择条件：

期刊=计算机研究与发展

共条记录，以下是1-2

全选清除导出

参考文献引证文献引用追踪

视图：

排序：

基于偏向信息学习的双层强化学习算法被引量：9: 《计算机研究与发展》2008年第9期1455-1462,共8页林芬石川罗杰文史忠植; 国家“八六三”高技术研究发展计划基金项目(2007AA01Z132);国家“九七三”重点基础研究发展规划基金项目(2003CB317004);国家自然科学基金项目(60775035,90604017)~~; 传统的强化学习存在收敛速度慢等问题,结合先验知识预置某些偏向可以加快学习速度.但是当先验知识不正确时又可能导致学习过程不收敛.对此,提出基于偏向信息学习的双层强化学习模型.该模型将强化学习过程和偏向信息学习过程结合起来:偏...; 关键词：强化学习 Q-学习算法偏向信息偏向信息学习先验知识

基于Metropolis准则的Q-学习算法研究被引量：14: 《计算机研究与发展》2002年第6期684-688,共5页郭茂祖王亚东刘扬孙华梅; 本课题得到国家"八六三"高技术研究发展计划(200lAA115550);国家自然科学基金(70071008);中国博士后科学基金资助; 探索与扩张是Q-学习算法中动作选取的关键问题,一味地扩张将使智能体很快地陷入局部最优,虽然探索可以跳出局部最优并加速学习,而过多的探索将影响算法的性能.通过把Q-学习中寻求最优策略表示为组合优化问题中最优解的搜索,将模拟退火...; 关键词：机器学习 METROPOLIS准则 Q-学习算法

全选清除导出

共1页<1>

检索报告对象比较聚类工具使用帮助返回顶部