基于半马氏博弈模型的分层强化学习研究被引量：2

Research on method of HRL based on SMG model

出　　处：《计算机工程与设计》2012年第9期3558-3562,共5页Computer Engineering and Design

基　　金：国家自然科学基金项目(60873139);山西省自然科学基金项目(2008011040);虚拟技术与系统国家重点实验室基金项目(SKVR-KF-09-04)

摘　　要：针对多Agent强化学习研究中面临的非马尔可夫环境和维数灾难问题,提出了一种半马氏博弈模型和MAHRL(multi-agent hierarchical reinforcement learning)协同框架。该模型弱化了系统对外界环境的要求,引入了随机时间步和通信策略的概念,更符合MAHRL研究的实际情况;协同框架中分别用SMG和SMDP模型对不同子任务进行建模,明确了Agent之间的协同机制。通过实验证明了SMG模型和协同框架的有效性和优越性。A kind of Semi-Markov Game model and collaborative framework is presented,which can resolve some problems of multi-agent reinforcement learning,such as the non-Markov nature,curse of dimensionality,etc.The model has weakened the requirements to the environment and imported the conception of the stochastic time step and communication strategy.The framework uses SMG and SMDP models to describe the different subtask respectively and defines the coordination mechanism among Agents.The experiment proves the validity and superiority of SMG model and collaborative framework.

关键词：多AGENT强化学习分层强化学习部分感知半马氏博弈模型协同框架

分类号：TP18[自动化与计算机技术—控制理论与控制工程]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于半马氏博弈模型的分层强化学习研究被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于半马氏博弈模型的分层强化学习研究 被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于半马氏博弈模型的分层强化学习研究被引量：2