一种改进的自动分层算法BMAXQ  被引量:1

BMAXQ:improved algorithm of hierarchical reinforcement learning

在线阅读下载全文

作  者:胡坤[1] 余雪丽[1] 李志[1] 

机构地区:[1]太原理工大学计算机科学与技术学院,太原030024

出  处:《计算机工程与应用》2011年第30期1-3,共3页Computer Engineering and Applications

基  金:国家自然科学基金No.60873139;山西省自然科学基金(No.2008011040);北航虚拟现实技术与系统国家重点实验室开放课题(No.SKVR-KF-09-04)~~

摘  要:针对MAXQ算法存在的弊端,提出一种改进的分层学习算法BMAXQ。该方法修改了MAXQ的抽象机制,利用BP神经网络的特点,使得Agent能够自动发现子任务,实现各分层的并行学习,适应动态环境下的学习任务。An improved method of hierarchical reinforcement learning which named BMAXQ is presented in order to resolve the shortcomings of MAXQ.It amends the abstract mechanism of MAXQ and utilizes the virtues of BP neural network.This method can make agent find the subtasks automatically and realize parallel learning for every layer.It can be adapted to the learning tasks under the dynamic environment.

关 键 词:分层强化学习 MAXQ算法 BP神经网络 子任务 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象