中国博士后科学基金(200902483)

作品数:2被引量:3H指数:1
导出分析报告
相关作者:陈鑫吴敏袁姣红戴朝晖更多>>
相关机构:中南大学更多>>
相关期刊:《控制理论与应用》《Control Theory and Technology》更多>>
相关主题:贝叶斯学习智能体DECOMPOSITIONCOOPERATIVE_LEARNINGAPPROXIMATION更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-2
视图:
排序:
Cooperative learning with joint state value approximation for multi-agent systems被引量:1
《控制理论与应用(英文版)》2013年第2期149-155,共7页Xin CHEN Gang CHEN Weihua CAO Min WU 
supported by National Nature Science Foundation of China(Nos.61074058,60874042);the Chinese Postdoctoral Science Foundation(No.200902483);the Specialized Research Fund for the Doctoral Program of Higher Education of China(No.20090162120068);the Central South University Innovation Project(No.2011ssxt221)
This paper relieves the 'curse of dimensionality' problem, which becomes intractable when scaling rein- forcement learning to multi-agent systems. This problem is aggravated exponentially as the number of agents inc...
关键词:Multi-agent system Q-LEARNING Cooperative system Curse of dimensionality DECOMPOSITION 
基于概率模型的动态分层强化学习被引量:2
《控制理论与应用》2011年第11期1595-1600,1606,共7页戴朝晖 袁姣红 吴敏 陈鑫 
国家自然科学基金资助项目(60874042);中国博士后科学基金一等资助项目(20080440177);中国博士后科学基金特别资助项目(200902483);教育部高等学校博士点基金新教师基金资助项目(20090162120068)
为解决大规模强化学习中的"维度灾难"问题,克服以往学习算法的性能高度依赖于先验知识的局限性,本文提出一种基于概率模型的动态分层强化学习方法.首先基于贝叶斯学习对状态转移概率进行建模,建立基于概率参数的关键状态识别方法,进而...
关键词:动态分层强化学习 贝叶斯学习 状态转移概率模型 智能体 
检索报告 对象比较 聚类工具 使用帮助 返回顶部