基于Policy Gradient的机械臂运动跟踪控制器参数整定  被引量:4

Parameter tuning of manipulator motion tracking controller based on Policy Gradient

在线阅读下载全文

作  者:韩霖骁 胡剑波[1] 宋仕元 王应洋 贺子厚 张鹏[1] HAN Linxiao;HU Jianbo;SONG Shiyuan;WANG Yingyang;HE Zihou;ZHANG Peng(Equipment Management and Unmanned Aerial Vehicle Engineering College,Airforce and Engineering University,Xi’an 710051,China)

机构地区:[1]空军工程大学装备管理与无人机工程学院,陕西西安710051

出  处:《系统工程与电子技术》2021年第9期2605-2611,共7页Systems Engineering and Electronics

基  金:工业控制技术国家重点实验室开放课题(ICT20063)资助课题。

摘  要:针对机械臂运动跟踪控制器的参数自整定问题,设计了一种基于强化学习Policy Gradient法的参数整定器。首先,介绍了机械臂的一种混合动力学模型,根据该系统模型进行了比例微分(proportional-derivative,PD)控制器设计和李雅普诺夫稳定性证明,并由此给出了参数矩阵的范围。其次,设计了基于Policy Gradient的参数整定器,通过引入积分器的方法对其进行改进,使其控制下的参数行为连续化以进一步提高PD控制器的控制效果。最后,以二阶机械臂系统为例进行了仿真验证。实验数据证明了该参数整定器的有效性和可行性,并能有效提升系统的动态性能。Aiming at the parameter self-tuning problem of the manipulator motion tracking controller, a parameter tuning device based on reinforcement learning Policy Gradient method is designed. Firstly, a hybrid dynamic model of manipulator is introduced. According to the system model, the design of proportional-derivative (PD) controller and the stability of LyapunoVare carried out, and the range of parameter matrix is given. Secondly, the parameter tuning device based on Policy Gradient is designed. The integrator is introduced to improve the parameter tuning of gradient, sOas to further improve the control effect of PD controller. Finally, a second-order manipulator system is taken as an example to verify the effectiveness and feasibility of the parameter tuning device, which effectively improves the dynamic performance of the proposed system.

关 键 词:机械臂 运动跟踪 Policy Gradient 参数整定 比例微分控制 

分 类 号:O231.2[理学—运筹学与控制论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象