多AGENT学习

作品数:13被引量:33H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:王长缨黄庆成周浦城洪炳镕宋梅萍更多>>
相关机构:国防科学技术大学哈尔滨工业大学哈尔滨工程大学南京大学更多>>
相关期刊:《模式识别与人工智能》《长春工程学院学报(自然科学版)》《计算机工程与应用》《电子学报》更多>>
相关基金:国家自然科学基金上海市科学技术委员会资助项目上海市教育委员会创新基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=电子学报x
条 记 录,以下是1-1
视图:
排序:
一种新颖的多agent强化学习方法被引量:8
《电子学报》2006年第8期1488-1491,共4页周浦城 洪炳镕 黄庆成 
国家自然科学基金(No.69985002)
提出了一种综合了模块化结构、利益分配学习以及对手建模技术的多agent强化学习方法,利用模块化学习结构来克服状态空间的维数灾问题,将Q-学习与利益分配学习相结合以加快学习速度,采用基于观察的对手建模来预测其他agent的动作分布.追...
关键词:多AGENT学习 Q-学习 利益分配学习 模块化结构 对手建模 
检索报告 对象比较 聚类工具 使用帮助 返回顶部