数据驱动的策略优化控制律设计最新研究综述被引量：1

Survey of recent progress in data-driven policy optimization for controller design

作　　者：赵斐然游科友[1] Feiran ZHAO;Keyou YOU(Department of Automation,Tsinghua University,Beijing 100084,China)

出　　处：《中国科学：信息科学》2023年第6期1027-1049,共23页Scientia Sinica(Informationis)

基　　金：国家自然科学基金(批准号:62033006);清华大学自主科研计划资助项目。

摘　　要：随着通信技术和新一代人工智能的迅速发展,强化学习这一数据驱动的控制方法引起了极大的关注.本文回顾了强化学习中的一类典型方法——策略优化法——在系统控制律设计上的最新研究进展.主要讨论了其在各种重要线性最优控制问题上的收敛性及样本复杂度,例如线性二次控制、输出反馈控制、H∞控制、分布式控制等.此外,对策略优化法在网络化系统控制中的应用作了展望.With the development of communication technology and artificial intelligence,reinforcement learning(RL),as a data-driven control method,has received tremendous attention.The purpose of this survey is to provide an overview of the state-of-the-art policy optimization method for controller design,which is a typical RL method.In particular,we discuss its convergence and sample complexity in certain fundamental optimal control problems in linear systems,such as linear quadratic regulators,output feedback,H∞control,and distributed control.Additionally,we discuss some future work on the policy optimization for control systems.

关键词：线性系统最优控制策略梯度法强化学习数据驱动控制

分类号：TP273[自动化与计算机技术—检测技术与自动化装置] TP181[自动化与计算机技术—控制科学与工程]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

数据驱动的策略优化控制律设计最新研究综述被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

数据驱动的策略优化控制律设计最新研究综述 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

数据驱动的策略优化控制律设计最新研究综述被引量：1