Q-学习算法

作品数:27被引量:135H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:胡子婴张峰徐如燕张宇轩刘凯更多>>
相关机构:哈尔滨理工大学哈尔滨工业大学河北大学吉林大学更多>>
相关期刊:《西南交通大学学报》《上海交通大学学报》《电子技术应用》《北京理工大学学报》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划河北省教育厅青年基金中国博士后科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=控制与决策x
条 记 录,以下是1-1
视图:
排序:
基于改进Q-学习算法的多阶段群体决策模型被引量:4
《控制与决策》2019年第9期1917-1922,共6页张峰 刘凌云 郭欣欣 
国家自然科学基金项目(61672205);河北省自然科学面上基金项目(F2017201020,F2018201115);河北省教育厅青年基金项目(QN2015026,QN2017019)
多阶段群体决策问题是一类典型的动态群体决策问题,主要针对离散的确定状态下的最优群体决策问题求解.但由于现实环境面临的大部分是不确定状态空间,甚至是未知环境空间(例如状态转移概率矩阵完全未知),为了寻求具有较高共识度的多阶段...
关键词:群体决策 多阶段群体决策 强化学习 Q-学习 群体共识 不确定性 
检索报告 对象比较 聚类工具 使用帮助 返回顶部