一种模糊强化学习算法及其在RoboCup中的应用  

A Fuzzy Reinforcement Learning Algorithm and Its Application in RoboCup Environment

在线阅读下载全文

作  者:高建清[1] 王浩[1] 于磊[1] 方宝富[1] 

机构地区:[1]合肥工业大学计算机与信息学院,合肥230009

出  处:《计算机工程与应用》2006年第6期52-54,共3页Computer Engineering and Applications

基  金:安徽省自然科学基金资助项目(编号:03042305)

摘  要:传统的强化学习算法只能解决离散状态空间和动作空间的学习问题。论文提出一种模糊强化学习算法,通过模糊推理系统将连续的状态空间映射到连续的动作空间,然后通过学习得到一个完整的规则库。这个规则库为Agent的行为选择提供了先验知识,通过这个规则库可以实现动态规划。作者在RoboCup环境中验证了这个算法,实现了踢球策略的优化。Conventional reinforcement algorithms only deal with discrete state spaces and discrete action spaces.In this paper,we propose a fuzzy reinforcement algorithm,which map continuous state spaces to continuous action spaces by fuzzy inference system and then learn a rule base.The rule base provides prior knowledge for agent's action selection and dynamic programming.We confirm the algorithm in RoboCup environment and implement the optimization of kick skill.

关 键 词:强化学习 模糊推理系统 模糊Q学习 ROBOCUP 踢球技术 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象