随机最优控制

作品数:163被引量:438H指数:10
导出分析报告
相关领域:理学更多>>
相关作者:朱位秋应祖光彭勇波李杰刘海龙更多>>
相关机构:浙江大学同济大学山东大学天津大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金浙江省自然科学基金创新研究群体科学基金广东省自然科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 学科=自动化与计算机技术x
条 记 录,以下是1-10
视图:
排序:
融合自适应评判的随机系统数据驱动策略优化
《自动化学报》2024年第5期980-990,共11页王鼎 王将宇 乔俊飞 
国家自然科学基金(62222301,61890930-5,62021003);科技创新2030——“新一代人工智能”重大项目(2021ZD0112302,2021ZD0112301)资助。
自适应评判技术已经广泛应用于求解复杂非线性系统的最优控制问题,但利用其求解离散时间非线性随机系统的无限时域最优控制问题还存在一定局限性.本文融合自适应评判技术,建立一种数据驱动的离散随机系统折扣最优调节方法.首先,针对宽...
关键词:自适应评判设计 数据驱动 离散系统 神经网络 Q-LEARNING 随机最优控制 
多目标动态优化中Pareto随机合作博弈研究综述被引量:5
《控制与决策》2023年第7期1789-1801,共13页张维海 彭称称 蒋秀珊 
国家自然科学基金项目(61973198,62203247);山东省泰山学者计划项目.
随着经济全球化的不断深入,“合作共赢”的发展战略越来越被人们接受,进而合作博弈也被合理地应用到多个领域.与静态合作博弈相比,动态博弈的约束条件为动态方程,其具有优化行为、多个玩家共同存在、决策结果的持久性以及对环境变化的...
关键词:PARETO最优性 合作博弈 随机最优控制 线性二次控制 平均场理论 
基于路径积分强化学习方法的蛇形机器人目标导向运动被引量:12
《模式识别与人工智能》2019年第1期1-9,共9页方勇纯 朱威 郭宪 
国家自然科学基金项目(No.61603200;U1613210)资助~~
路径积分方法源于随机最优控制,是一种数值迭代方法,可求解连续非线性系统的最优控制问题,不依赖于系统模型,快速收敛.文中将基于路径积分强化学习的策略改善方法用于蛇形机器人的目标导向运动.使用路径积分强化学习方法学习蛇形机器人...
关键词:路径积分 强化学习 随机最优控制 蛇形机器人 目标导向 
四阶动力学建模和随机最优控制的UAV目标跟踪
《计算机工程与应用》2017年第12期234-240,共7页蔡鹏飞 张正本 孙挺 
国家重点基础研究发展规划(973计划)前期研究专项(No.2011CB311802);河南省教育厅科学技术研究重点项目(No.13A520221;No.14A520045);河南省教育科学"十二五"规划课题豫教科[2012]844号文(No.[2012]-JKGHAC-0116*)
现存大多数固定翼无人机(UAV)跟踪地面目标的方法需要一个或多个严格的假设,限制了实际应用,针对此问题,提出一种基于四阶动力学建模和随机最优控制的UAV跟踪方法。使用四阶动力学方程对UAV随机动态和目标进行初始化建模;通过一个适当...
关键词:固定翼无人机 随机动态 随机优化控制 门特卡罗样本 瞬时视场角 
变采样周期网络控制系统的随机最优控制
《工业控制计算机》2016年第9期12-13,共2页时维国 卢小永 
针对网络控制系统中的时延不确定性和系统状态难以检测的问题,提出设计状态观测器重构系统状态,将当前时刻的时延值作为采样周期建立变采样周期网络控制系统模型,把系统转化为没有时延的时变系统;并提出了一种随机最优状态反馈控制器的...
关键词:网络控制系统 变采样周期 时延补偿 控制器 
完全耦合正倒向随机控制系统的动态规划原理与最大值原理之间的联系
《山东大学学报(理学版)》2016年第5期121-129,共9页聂天洋 史敬涛 
国家自然科学基金资助项目(61573217;11571205;11301011;11201264);山东省自然科学基金资助项目(JQ201401;ZR2015JL003);山东大学基本科研业务费资助项目(2015HW023)
研究了完全耦合正倒向随机控制系统的动态规划原理和最大值原理之间的联系,其递归效用泛函由受控完全耦合的正倒向随机微分方程的解给出。主要结果是在一定的光滑性假设下,给出了最优值函数、广义哈密顿函数和对偶过程之间的联系,但正...
关键词:随机最优控制 完全耦合正倒向随机微分方程 动态规划原理 最大值原理 
基于逆系统方法的永磁同步风力发电系统随机最优控制被引量:1
《郑州大学学报(工学版)》2015年第3期16-19,共4页刘艳红 齐书康 
国家自然科学基金资助项目(61473265);河南省教育厅科学技术重点研究项目(13A520379)
风力发电系统是典型的强耦合非线性随机系统.针对永磁同步风力发电系统的随机最优控制问题,建立了系统的非线性动态模型;然后,采用逆系统方法设计了反馈线性化控制器,将永磁同步风力发电系统转化为具有线性传递关系且已解耦的伪线性系统...
关键词:风力发电系统 永磁同步发电机 逆系统方法 随机最优控制 
具有乘性噪声的线性离散时间随机控制系统综述被引量:6
《控制理论与应用》2013年第8期929-946,共18页刘光明 苏为洲 
国家自然科学基金重点资助项目(60834003);国家自然科学基金资助项目(61273109;60774057)
具有乘性噪声的随机不确定系统的控制问题有着广泛的应用背景.本文概述了具有乘性噪声的线性离散时间随机系统的稳定性分析、均方镇定、最优控制以及最优估计问题和相关结论.同时,本文研究了具有状态与控制乘性噪声的线性多变量离散时...
关键词:线性离散时间随机系统 乘性噪声 均方镇定 随机最优控制 最优估计 
基于自适应GPC的舵和水舱联合减摇系统研究被引量:2
《微计算机信息》2012年第10期14-16,共3页官英双 彭秀艳 赵希人 
在研究了舵和水舱联合减横摇控制方法的基础上,建立了广义预测控制(GPC)的预测模型,用递推最小二乘法在线估计预测模型参数,求出使船舶横摇角广义稳态方差最小的控制律,用传统的开关式气阀控制,使水舱产生对抗海浪干扰的力矩;接着运用ka...
关键词:联合减摇 舵/可控被动式减摇水舱 自适应GPC LQG控制 随机最优控制 
强化学习理论在电力系统中的应用及展望被引量:30
《电力系统保护与控制》2009年第14期122-128,共7页余涛 周斌 甄卫国 
国家自然科学基金项目(50807016);广东省自然科学基金博士启动基金项目(06300091)~~
强化学习理论是人工智能领域中机器学习方法的一个重要分支,也是马尔可夫决策过程的一类重要方法。所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大。强化学习理论及其应用研究近年来日益受到国际机...
关键词:人工智能 强化学习 马尔可夫决策过程 随机最优控制 电力系统 
检索报告 对象比较 聚类工具 使用帮助 返回顶部