李浩

作品数:1被引量:9H指数:1
导出分析报告
供职机构:西安电子科技大学计算机学院更多>>
发文主题:Q学习启发函数更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《模式识别与人工智能》更多>>
所获基金:中央高校基本科研业务费专项资金国家自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-1
视图:
排序:
基于状态回溯代价分析的启发式Q学习被引量:9
《模式识别与人工智能》2013年第9期838-844,共7页方敏 李浩 
国家自然科学基金项目(No.61070143,61101248);中央高校基本科研业务费项目(No.K5051203003)资助
由于强化学习算法动作策略学习比较费时,提出一种基于状态回溯的启发式强化学习方法.分析强化学习过程中重复状态,通过比较状态回溯过程中重复动作的选择策略,引入代价函数描述重复动作的重要性.结合动作奖赏及动作代价提出一种新的启...
关键词:代价分析 启发函数 状态回溯 Q学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部