一种基于状态聚类的SARSA(λ)强化学习算法被引量：3

SARSA( λ) Algorithm of Reinforcement Learning Basd on States Clustering

出　　处：《计算机工程》2003年第5期37-38,98,共3页Computer Engineering

摘　　要：为求解大状态空间的强化学习问题，提出了一种基于状态聚类的SARSA(λ)强化学习算法，其基本思想是利用先验知识或事先训练控制器，对状态空间进行聚类，分为不同的簇，然后在簇空间上进行SARSA(λ)学习。若能进行适当的状态聚类，算法将可得到一个相对好的近似值函数.For solving large-scale reinforcement learning problem, a new SARSA(λ) algorithm of reinforcement learning based on states clustering is proposed. The principle idea of the algorithm is that it can first use the prior knowledge or train the controller to cluster the state space, the state space is lelustered to many clusters, then do SARSA(λ) learning in the cluster space. If the states are clustered properly, the algorithm can get a suitable approximate value function.

关键词：SARSA(λ)强化学习算法状态聚类强化学习函数近似 SARSA学习人工神经网络

分类号：TP183[自动化与计算机技术—控制理论与控制工程]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种基于状态聚类的SARSA(λ)强化学习算法被引量：3

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种基于状态聚类的SARSA(λ)强化学习算法 被引量：3

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

一种基于状态聚类的SARSA(λ)强化学习算法被引量：3