一种改进的自动分层算法BMAXQ 被引量：1

BMAXQ:improved algorithm of hierarchical reinforcement learning

出　　处：《计算机工程与应用》2011年第30期1-3,共3页Computer Engineering and Applications

基　　金：国家自然科学基金No.60873139;山西省自然科学基金(No.2008011040);北航虚拟现实技术与系统国家重点实验室开放课题(No.SKVR-KF-09-04)~~

摘　　要：针对MAXQ算法存在的弊端,提出一种改进的分层学习算法BMAXQ。该方法修改了MAXQ的抽象机制,利用BP神经网络的特点,使得Agent能够自动发现子任务,实现各分层的并行学习,适应动态环境下的学习任务。An improved method of hierarchical reinforcement learning which named BMAXQ is presented in order to resolve the shortcomings of MAXQ.It amends the abstract mechanism of MAXQ and utilizes the virtues of BP neural network.This method can make agent find the subtasks automatically and realize parallel learning for every layer.It can be adapted to the learning tasks under the dynamic environment.

关键词：分层强化学习 MAXQ算法 BP神经网络子任务

分类号：TP18[自动化与计算机技术—控制理论与控制工程]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种改进的自动分层算法BMAXQ 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种改进的自动分层算法BMAXQ 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索