基于再励学习的被动动态步行机器人被引量：6

Reinforcement learning for passive dynamic walking robot

作　　者：毛勇[1] 李实[1] 王家廞[1] 贾培发[1] 杨泽红[1] 丘振[1]

机构地区：[1]清华大学计算机科学与技术系,智能技术与系统国家重点实验室,北京100084

出　　处：《清华大学学报（自然科学版）》2008年第1期92-96,共5页Journal of Tsinghua University(Science and Technology)

摘　　要：为了研究仿人、能量高效的双足机器人步行,研制了由MACCEPA(mechanically adjustable compliance and controllable equilibrium position actuator)柔性驱动器驱动的半被动双足机器人,并实现了其动力学仿真系统。提出一种基于再励学习的步行控制方法。该方法首先采用Q-学习方法学习机器人在理想环境中的稳定步行步态及其控制策略,然后将此步态和控制策略作为模糊优胜学习方法的参考步态和参考控制策略并在线学习模糊网络的优胜值参数。仿真结果表明:利用学习训练的结果控制柔性驱动器在步行相转换时的动作,机器人可以实现稳定动态步行。A quasi-passive dynamic walking robot was built to study natural, energy-efficient biped walking. The robot was actuated by mechanically adjustable compliance and controllable equilibrium position actuators （MACCEPA）. A reinforcement learning based method was used to control the robot to walk. The method firstly learned the desired gait for walking in ideal environment with a gait model based Q-learning algorithm. Then, a fuzzy advantage learning method was used to teach the robot to walk in uneven floor. Stable walking of the robot is achieved by using the learning result to control the action of the actuators when changes occur in the walking phase. The effectiveness of the method was verified by simulations.

关键词：机器人双足机器人被动动态步行再励学习

分类号：TP242[自动化与计算机技术—检测技术与自动化装置]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于再励学习的被动动态步行机器人被引量：6

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于再励学习的被动动态步行机器人 被引量：6

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于再励学习的被动动态步行机器人被引量：6