一种基于状态聚类的SARSA(λ)强化学习算法  被引量:3

SARSA( λ) Algorithm of Reinforcement Learning Basd on States Clustering

在线阅读下载全文

作  者:李春贵[1] 吴沧浦[1] 刘永信[1] 

机构地区:[1]北京理工大学自动控制系,北京100081

出  处:《计算机工程》2003年第5期37-38,98,共3页Computer Engineering

摘  要:为求解大状态空间的强化学习问题,提出了一种基于状态聚类的SARSA(λ)强化学习算法,其基本思想是利用先验知识或事先训练控制器,对状态空间进行聚类,分为不同的簇,然后在簇空间上进行SARSA(λ)学习。若能进行适当的状态聚类,算法将可得到一个相对好的近似值函数.For solving large-scale reinforcement learning problem, a new SARSA(λ) algorithm of reinforcement learning based on states clustering is proposed. The principle idea of the algorithm is that it can first use the prior knowledge or train the controller to cluster the state space, the state space is lelustered to many clusters, then do SARSA(λ) learning in the cluster space. If the states are clustered properly, the algorithm can get a suitable approximate value function.

关 键 词:SARSA(λ)强化学习算法 状态聚类 强化学习 函数近似 SARSA学习 人工神经网络 

分 类 号:TP183[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象