内在激励强化学习及其在Robocup仿真中的应用  被引量:3

Intrinsic Motivation Reinforcement Learning and Its Application to Robocup Simulation

在线阅读下载全文

作  者:李楠[1] 刘国栋[1] 

机构地区:[1]江南大学控制科学与工程研究中心,江苏无锡214122

出  处:《计算机仿真》2006年第4期160-162,共3页Computer Simulation

摘  要:针对以往的强化学习对单步动作学习的效率较低,从心理学角度引入内在激励的概念,并将其作为强化学习的激励信号,与外部激励信号一同作用于强化学习的整个过程。改变了传统意义上的强化学习的框架模式。在学习的过程中,不但要学习单步的动作值,同时还学连续动作的技巧值,通过构建各种“技巧”,来提高解决新问题的能力,使学习的效率得到很大的提高。最后将内在激励的强化学习运用于Robocup仿真组足球比赛当中。In order to increase the speed of the single step action learning, the conception of intrinsic motivation from psychology is introduced. We use intrinsic reinforcement signal, together with extrinsic reinforcement signal to act on the whole process of the learning. The traditional mode of reinforcement learning is changed. In the process of learning, not only the single action is learned, but also the skills with multiple actions. By constructing kinds of skills, the ability for solving new problem may be improved. At last, the intrinsic motivation reinforcement learning is used for Robocup simulation.

关 键 词:内在激励 强化学习 机器人足球 

分 类 号:TP242[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象