基于强化学习方法的悬浮车停车混合控制设计

Design of Superconductor Levitating Train Hybrid Control System Based on Q-Learning Method

机构地区：[1]广州华南理工大学自动化科学与工程学院 [2]广州华南理工大学

出　　处：《微计算机信息》2008年第22期287-288,106,共3页Control & Automation

基　　金：高校博士点基金教育部"切换控制在飞行机器人导航控制中的应用[20040561031]";国家自然科学基金国家自然科学基金委员会"有限时间切换系统研究与应用[60374036]";小型飞行机器人的多模态切换控制策略研究[60574004];广东省自然科学基金广东省自然科学基金委员会"有限时间切换系统[031407]"

摘　　要：强化方法是一种通过行为学习,得到最佳控制策略的方法。本文研究利用这种方法实现项目中超导悬浮车运动过程最佳停车问题。通过模型的建立,转化为求导系统的最优化问题;超导磁悬浮车的控制由于会受到电磁干扰、悬浮高度等的影响,用传统的方法求解控制方法将需要求得精确的控制模型;而利用Q-Learning方法,通过多次样本的学习,寻求最佳的控制策略,则可求得在不同速度下的最佳控制策略。最后,使用Q-Learning方法的控制策略在仿真中得到了很好的效果,该控制方法将进一步应用于超导模型悬浮车的控制。Q-Learning method is a method which is used to obtain the optimal strategy by action Learning. The paper uses the method to realize the optimal action in superconductor levitating model train. The realistic system is translated to optimal problem by the modeling. The optimal controlling strategy is obtained by samples selected. Finally the simulation demonstrates a successful rea- sonable performance, the control method will be used to control the superconductor levitating model train in the next step.

关键词：强化学习混合控制系统建模最优化高斯噪声

分类号：TP332.1[自动化与计算机技术—计算机系统结构]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于强化学习方法的悬浮车停车混合控制设计

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于强化学习方法的悬浮车停车混合控制设计

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索