基于迭代神经动态规划的数据驱动非线性近似最优调节  被引量:10

Data-driven Nonlinear Near-optimal Regulation Based on Iterative Neural Dynamic Programming

在线阅读下载全文

作  者:王鼎[1,2] 穆朝絮[2] 刘德荣[3] 

机构地区:[1]中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190 [2]天津市过程检测与控制重点实验室天津大学电气自动化与信息工程学院,天津300072 [3]北京科技大学自动化学院,北京100083

出  处:《自动化学报》2017年第3期366-375,共10页Acta Automatica Sinica

基  金:国家自然科学基金(61233001,61273140,61304018,61304086,61533017,U1501251,61411130160);北京市自然科学基金(4162065);天津市自然科学基金(14JCQNJC05400);中国科学院自动化研究所复杂系统管理与控制国家重点实验室优秀人才基金;天津市过程检测与控制重点实验室开放课题基金(TKLPMC-201612)资助~~

摘  要:利用数据驱动控制思想,建立一种设计离散时间非线性系统近似最优调节器的迭代神经动态规划方法.提出针对离散时间一般非线性系统的迭代自适应动态规划算法并且证明其收敛性与最优性.通过构建三种神经网络,给出全局二次启发式动态规划技术及其详细的实现过程,其中执行网络是在神经动态规划的框架下进行训练.这种新颖的结构可以近似代价函数及其导函数,同时在不依赖系统动态的情况下自适应地学习近似最优控制律.值得注意的是,这在降低对于控制矩阵或者其神经网络表示的要求方面,明显地改进了迭代自适应动态规划算法的现有结果,能够促进复杂非线性系统基于数据的优化与控制设计的发展.通过两个仿真实验,验证本文提出的数据驱动最优调节方法的有效性.An iterative neural dynamic programming approach is established to design the near optimal regulator of discrete-time nonlinear systems using the data-driven control formulation. An iterative adaptive dynamic programming algorithm for discrete-time general nonlinear systems is developed and proved to guarantee the property of convergence and optimality. Then, a globalized dual heuristic programming technique is developed with detailed implementation by constructing three neural networks, where the action network is trained under the framework of neural dynamic programming. This novel architecture can approximate the cost function with its derivative, and simultaneously, adaptively learn the near-optimal control law without depending on the system dynamics. It is significant to observe that it greatly improves the existing results of iterative adaptive dynamic programming algorithm, in terms of reducing the requirement of control matrix or its neural network expression, which promotes the development of data-based optimization and control design for complex nonlinear systems. Two simulation experiments are described to illustrate the effectiveness of the data-driven optimal regulation method.

关 键 词:自适应动态规划 数据驱动控制 迭代神经动态规划 神经网络 非线性近似最优调节 

分 类 号:O232[理学—运筹学与控制论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象