检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]华南理工大学电力学院,广东广州510640 [2]广东工业大学自动化学院,广东广州510090
出 处:《控制理论与应用》2005年第2期291-294,300,共5页Control Theory & Applications
基 金:国家自然科学基金资助项目(60174025);国家重点基础研究专项经费资助项目(G1998020308).
摘 要:提出了一种基于强化学习的模型参考自适应控制方法,控制器采用自适应启发评价算法,它由两部分组成:自适应评价单元及联想搜索单元.由参考模型给出系统的性能指标,利用系统反馈的强化信号在线更新控制器的参数.仿真结果表明:基于强化学习的模型参考自适应控制方法可以实现对一类复杂的非线性系统的稳定控制和鲁棒控制,该控制方法不仅响应速度快,而且具有较高的学习速率,实时性较强.Aiming at adaptive control problems of a sort of nonlinear system,model reference adaptive control based on reinforcement learning is proposed.The controller uses adaptive heuristic critic algorithm,which consists of two elements:adaptive critic element,associative search element.The desired performance index is presented by the reference model,and the controller parameters are updated by reinforcement signal given by system.The simulation shows that the proposed method is efficient for a class of complex nonlinear system,and it has a high learning rate,which is important to online learning.
关 键 词:强化学习 模型参考自适应控制 联想搜索单元 自适应评价单元
分 类 号:TP273.2[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.117.121.71