基于未知环境状态新定义及知识启发的机器人导航Q学习算法被引量：1

A Q-Learning Algorithm for Robot Navigation Based on a New Definition of an Unknown Environment States and Knowledge Heuristic

作　　者：童小龙[1] 姚明海[1] 张灿淋

机构地区：[1]浙江工业大学信息工程学院,杭州310023

出　　处：《计算机系统应用》2014年第1期149-153,共5页Computer Systems & Applications

基　　金：国家自然科学基金(61070113)

摘　　要：由于强大的自主学习能力,强化学习方法逐渐成为机器人导航问题的研究热点,但是复杂的未知环境对算法的运行效率和收敛速度提出了考验.提出一种新的机器人导航Q学习算法,首先用三个离散的变量来定义环境状态空间,然后分别设计了两部分奖赏函数,结合对导航达到目标有利的知识来启发引导机器人的学习过程.实验在Simbad仿真平台上进行,结果表明本文提出的算法很好地完成了机器人在未知环境中的导航任务,收敛性能也有其优越性.Due to powerful self-learning ability, reinforcement learning has become a research hot spot about robot navigation problems, but the operating efficiency and convergence speed of the algorithm are tried by the the complex unknown environment. A new Q-learning algorithm for robot navigation was proposed in this paper. First, three discrete variables were used to define the space states of the environment, and then two parts of the reward functions were designed, combining the beneficial knowledge for reaching the target to inspire and guide the robot＇s learning process. The experiment was executed on Simbad simulation platform. The results show that the proposed algorithm is well done in an unknown environment robot navigation task, and has a better convergence speed.

关键词：强化学习状态定义知识启发 Simbad平台

分类号：TP242[自动化与计算机技术—检测技术与自动化装置]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于未知环境状态新定义及知识启发的机器人导航Q学习算法被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于未知环境状态新定义及知识启发的机器人导航Q学习算法 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于未知环境状态新定义及知识启发的机器人导航Q学习算法被引量：1