基于递阶强化学习的自主机器人路径规划智能体被引量：6

Autonomous robots path planning agent based on hierarchical reinforcement learning

作　　者：王文玺[1] 肖世德[1] 孟祥印[1] 陈应松[1] 张卫华[2]

机构地区：[1]西南交通大学机械工程学院,四川成都610031 [2]西南交通大学牵引动力国家重点实验室,四川成都610031

出　　处：《计算机集成制造系统》2009年第6期1215-1221,共7页Computer Integrated Manufacturing Systems

基　　金：国家973计划资助项目(2007CB714701)~~

摘　　要：递阶强化学习是解决状态空间庞大的复杂系统智能体决策的有效方法。通过引入启发式算法思想,对一种递阶强化学习方法进行改进,使得智能体在学习过程中融入了历史信息,提高了学习效率,解决了在庞大状态空间和动态变化环境中对智能体进行最优行为策略学习的问题。以扩展的信念、愿望和意图意识模型为基础,提出了一种具有主动性、自治性、反应性、社会性的自主机器人路径规划智能体体系结构,通过仿真实验,证明了路径规划智能体的可行性和有效性。Hierarchical reinforcement learning was an effective method to solve decision problems for complex system agent with enormous number of states. By introducing heuristic algorithm, a hierarchical reinforcement learning method was improved, making the agent obtain historical information in the learning process to increase the learning efficiency so as to solve the optimal strategy of agent learning problem in large-scale state space and dynamic environment. Based on expanded Belief Desire Intention （BDI） model, the architecture of autonomous robot path planning agent was presented with properties as initiative, autonomy, reactivity and sociability. It was proved by simulation that the path planning agent was feasible and effective.

关键词：智能体强化学习意识模型路径规划

分类号：TP391.41[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于递阶强化学习的自主机器人路径规划智能体被引量：6

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于递阶强化学习的自主机器人路径规划智能体 被引量：6

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于递阶强化学习的自主机器人路径规划智能体被引量：6