一种基于划分和集成思想的多智能体强化学习被引量：1

An Multiagent Reinforcement Learning Based on Partition and Integration

出　　处：《南京师范大学学报（工程技术版）》2008年第4期59-62,共4页Journal of Nanjing Normal University(Engineering and Technology Edition)

基　　金：国家自然科学基金(70802025)资助项目

摘　　要：针对Q学习状态空间非常大,导致收敛速度非常慢的问题,利用智能体在不同样本上分类性能不同,提出了基于样本的学习误差对样本空间进行划分,充分发掘了样本和智能体的匹配关系.以带障碍物的格子世界作为仿真环境,表明该算法提高了在线学习性能.To counter for the problem of slowly convergence of Q leaning when comeing to large state-space, the paper puts forward an algorithm which divide the states space according to learning errors. The basic idea of our algorithm is to discover the matching relationship between agents and the sub-space of states space. The simulations in grids with blocks indicate that the algorithm performs better when comeing to on-line learning.

关键词：多智能体系统强化学习状态空间划分

分类号：TP301[自动化与计算机技术—计算机系统结构]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种基于划分和集成思想的多智能体强化学习被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种基于划分和集成思想的多智能体强化学习 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

一种基于划分和集成思想的多智能体强化学习被引量：1