基于RPkNN-Sarsa(λ)强化学习的机器人路径规划方法  被引量:4

Method of RPkNN-Sarsa(λ) reinforcement learning for robot path planning

在线阅读下载全文

作  者:王军红[1] 江虹[1] 黄玉清[1] 伍晓利[2] 

机构地区:[1]西南科技大学信息工程学院,四川绵阳621010 [2]中国工程物理研究院核物理与化学研究所,四川绵阳621010

出  处:《计算机应用研究》2013年第1期199-201,共3页Application Research of Computers

基  金:国防基础科研计划资助项目(B3120110005);四川省科技厅基金资助项目(2010JZ0020;09ZA136)

摘  要:基于kNN-Sarsa(λ)强化学习的机器人路径规划方法虽然收敛速度快,但该算法容易陷入局部最优值,且未考虑环境信息的不完全可观测性。为此,设计了一种随机扰动(random perturbation)kNN-Sarsa(λ)强化学习算法,利用Bayesian规则对传感器探测信息的不确定性进行了处理,建立了基于栅格地图的仿真环境模型。仿真实验结果表明,该方法不仅收敛性好,能有效缓解kNN-Sarsa(λ)算法易陷入局部最优的现象,且在传感器探测信息不确定的情况下仍能搜索到最优路径。The method of robot path planning based on kNN-Sarsa(λ) reinforcement learning has fast convergence speed,but the algorithm is easy to fall into local optimal value and does not consider incomplete observability of environmental information.With regards to this,this paper designed a method of random perturbation kNN-Sarsa(λ) reinforcement learning algorithm.Also,it processed sensors detection data uncertainty using Bayesian theory.In addition,it used grid map to establish simulation environment model.The simulation experimental results show that the method not only has rapid convergence speed by alleviating the local optimal problem of kNN-Sarsa(λ) algorithm,but also can find a shortest path in the case of sensors detection data uncertainty.

关 键 词:路径规划 强化学习 随机扰动 传感器探测信息不确定性 

分 类 号:TP242[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象