检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]广东工业大学应用数学学院,广东广州
出 处:《人工智能与机器人研究》2019年第2期46-56,共11页Artificial Intelligence and Robotics Research
基 金:广东省自然科学基金项目(No.2018A030313505);广东省科技计划项目(No.2017B010124003,No.2017 B090909001)。
摘 要:为了实现无模型离散时间非线性动态系统的最优控制,提出了一种新的基于数据驱动的神经动态规划方法。该方法利用Q函数的残差与基函数的内积为零,同时控制策略的残差与基函数的内积也为零,从而得到控制方程。接着使用离线数据集与在线数据来迭代更新神经网络的系数,从而得到近似最优的控制策略,本文还证明了该算法是收敛的。A new data-driven neural dynamicprogramming method for model-free discrete-time nonlinear dynamic system isproposed in this paper.The residual of the Q-function and the control strategyare operated to be zero with the basis function through the inner product.Thenthe coefficients of the neural network are updated by the offline trained dataand the online data.Finally the optimal control strategy is obtained and the convergenceof this algorithm is proved.
分 类 号:TP2[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3