Q-学习算法

作品数:27被引量:135H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:胡子婴张峰徐如燕张宇轩刘凯更多>>
相关机构:哈尔滨理工大学哈尔滨工业大学河北大学吉林大学更多>>
相关期刊:《西南交通大学学报》《上海交通大学学报》《电子技术应用》《北京理工大学学报》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划河北省教育厅青年基金中国博士后科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=上海交通大学学报x
条 记 录,以下是1-1
视图:
排序:
基于Markov对策和强化学习的多智能体协作研究被引量:7
《上海交通大学学报》2001年第2期288-292,共5页李晓萌 杨煜普 许晓鸣 
国家自然科学基金!资助项目 (3930 0 70 )
MAS的协作机制研究 ,当前比较适用的研究框架是非零和 Markov对策及基于 Q-算法的强化学习 .但实际上在这种框架下的 Agent强调独立学习而不考虑其他 Agent的行为 ,故 MAS缺乏协作机制 .并且 ,Q-算法要求 Agent与环境的交互时具有完备...
关键词:MARKOV对策 Q-学习算法 协调学习 多智能体系统 强化学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部