检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]广州华南理工大学自动化科学与工程学院 [2]广州华南理工大学
出 处:《微计算机信息》2008年第22期287-288,106,共3页Control & Automation
基 金:高校博士点基金教育部"切换控制在飞行机器人导航控制中的应用[20040561031]";国家自然科学基金国家自然科学基金委员会"有限时间切换系统研究与应用[60374036]";小型飞行机器人的多模态切换控制策略研究[60574004];广东省自然科学基金广东省自然科学基金委员会"有限时间切换系统[031407]"
摘 要:强化方法是一种通过行为学习,得到最佳控制策略的方法。本文研究利用这种方法实现项目中超导悬浮车运动过程最佳停车问题。通过模型的建立,转化为求导系统的最优化问题;超导磁悬浮车的控制由于会受到电磁干扰、悬浮高度等的影响,用传统的方法求解控制方法将需要求得精确的控制模型;而利用Q-Learning方法,通过多次样本的学习,寻求最佳的控制策略,则可求得在不同速度下的最佳控制策略。最后,使用Q-Learning方法的控制策略在仿真中得到了很好的效果,该控制方法将进一步应用于超导模型悬浮车的控制。Q-Learning method is a method which is used to obtain the optimal strategy by action Learning. The paper uses the method to realize the optimal action in superconductor levitating model train. The realistic system is translated to optimal problem by the modeling. The optimal controlling strategy is obtained by samples selected. Finally the simulation demonstrates a successful rea- sonable performance, the control method will be used to control the superconductor levitating model train in the next step.
分 类 号:TP332.1[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7