多步截断优先扫描强化学习算法

A Truncated Multi-step Prioritized Sweeping Reinforcement Learning Algorithm

作　　者：李春贵[1]

出　　处：《计算机工程》2005年第11期13-15,共3页Computer Engineering

基　　金：广西自然科学基金资助项目(桂科自0481016);广西工学院博士基金资助项目

摘　　要：研究了优先扫描的强化学习方法,通过定义新的迹,把多步截断即时差分学习用于集成规划的优先扫描强化学习,用多步截断即时差分来定义扫描优先权,提出一种改进的优先扫描强化学习算法并进行仿真实验,实验结果表明,新算法的学习效率有明显的提高。Prioritized sweeping reinforcement learning method is investigated. Giving a new definition of eligibility traces, truncated multi-step temporal difference learning can be used in integrating planning prioritized sweeping learning. Setting the priority as truncated multi-step temporal errors, an advanced prioritized sweeping RL algorithm is proposed. The results of experiment show that the algorithm has more effective performance.

关键词：强化学习优先扫描多步截断 MARKOV过程

分类号：TP18[自动化与计算机技术—控制理论与控制工程]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

多步截断优先扫描强化学习算法

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

多步截断优先扫描强化学习算法

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索