检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王军红[1] 江虹[1] 黄玉清[1] 伍晓利[2]
机构地区:[1]西南科技大学信息工程学院,四川绵阳621010 [2]中国工程物理研究院核物理与化学研究所,四川绵阳621010
出 处:《计算机应用研究》2013年第1期199-201,共3页Application Research of Computers
基 金:国防基础科研计划资助项目(B3120110005);四川省科技厅基金资助项目(2010JZ0020;09ZA136)
摘 要:基于kNN-Sarsa(λ)强化学习的机器人路径规划方法虽然收敛速度快,但该算法容易陷入局部最优值,且未考虑环境信息的不完全可观测性。为此,设计了一种随机扰动(random perturbation)kNN-Sarsa(λ)强化学习算法,利用Bayesian规则对传感器探测信息的不确定性进行了处理,建立了基于栅格地图的仿真环境模型。仿真实验结果表明,该方法不仅收敛性好,能有效缓解kNN-Sarsa(λ)算法易陷入局部最优的现象,且在传感器探测信息不确定的情况下仍能搜索到最优路径。The method of robot path planning based on kNN-Sarsa(λ) reinforcement learning has fast convergence speed,but the algorithm is easy to fall into local optimal value and does not consider incomplete observability of environmental information.With regards to this,this paper designed a method of random perturbation kNN-Sarsa(λ) reinforcement learning algorithm.Also,it processed sensors detection data uncertainty using Bayesian theory.In addition,it used grid map to establish simulation environment model.The simulation experimental results show that the method not only has rapid convergence speed by alleviating the local optimal problem of kNN-Sarsa(λ) algorithm,but also can find a shortest path in the case of sensors detection data uncertainty.
关 键 词:路径规划 强化学习 随机扰动 传感器探测信息不确定性
分 类 号:TP242[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3