Q-学习算法

作品数:27被引量:135H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:胡子婴张峰徐如燕张宇轩刘凯更多>>
相关机构:哈尔滨理工大学哈尔滨工业大学河北大学吉林大学更多>>
相关期刊:《西南交通大学学报》《上海交通大学学报》《电子技术应用》《北京理工大学学报》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划河北省教育厅青年基金中国博士后科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=电子科技x
条 记 录,以下是1-1
视图:
排序:
强化学习的模型、算法及应用被引量:9
《电子科技》2011年第1期47-49,共3页战忠丽 王强 陈显亭 
强化学习不需要具有先验知识,通过试错与环境交互获得策略的改进,具有自学习和在线学习能力,是构造智能体的核心技术之一。文中首先综述了强化学习模型和基本原理,然后介绍了强化学习的主要算法,包括Sarsa算法、TD算法、Q-学习算法及函...
关键词:强化学习 Sarsa算法 瞬时差分算法 Q-学习算法 函数估计 
检索报告 对象比较 聚类工具 使用帮助 返回顶部