云南高校图书馆联盟文献共享服务平台- 李浩

李浩: 作品数：1被引量：9H指数：1; 导出分析报告; 供职机构：西安电子科技大学计算机学院更多>>; 发文主题：Q学习启发函数更多>>; 发文领域：自动化与计算机技术更多>>; 发文期刊：《模式识别与人工智能》更多>>; 所获基金：中央高校基本科研业务费专项资金国家自然科学基金更多>>

-

在结果中检索

检索结果分析

署名顺序

全部
第一作者

结果分析中...

共条记录，以下是1-1

全选清除导出

参考文献引证文献引用追踪

视图：

排序：

基于状态回溯代价分析的启发式Q学习被引量：9: 《模式识别与人工智能》2013年第9期838-844,共7页方敏李浩; 国家自然科学基金项目(No.61070143,61101248);中央高校基本科研业务费项目(No.K5051203003)资助; 由于强化学习算法动作策略学习比较费时,提出一种基于状态回溯的启发式强化学习方法.分析强化学习过程中重复状态,通过比较状态回溯过程中重复动作的选择策略,引入代价函数描述重复动作的重要性.结合动作奖赏及动作代价提出一种新的启...; 关键词：代价分析启发函数状态回溯 Q学习

全选清除导出

共1页<1>

检索报告对象比较聚类工具使用帮助返回顶部