策略迭代

作品数:74被引量:214H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:奚宏生唐昊江琦殷保群陈曦更多>>
相关机构:合肥工业大学中国科学技术大学沈阳工业大学国防科学技术大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划江苏省自然科学基金安徽省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于强化学习的异构多智能体系统最优输出调节
《控制理论与应用》2025年第3期491-498,共8页熊春萍 马倩 
本文研究了异构多智能体系统的最优输出调节问题.通信网络拓扑含有向生成树.首先,设计了外部系统状态补偿器和状态反馈控制器,应用图论和Lyapunov稳定性理论证明了所设计的补偿器和控制器可以解决一般输出调节问题.然后,通过最小化预定...
关键词:异构多智能体系统 最优输出调节 策略迭代 无模型算法 强化学习 
分布式时滞系统LQR最优控制问题的PI算法
《理论数学》2025年第2期104-113,共10页陈甲敏 孙小淇 
山东省自然科学基金(面上基金) ZR2024MA097。
本文将基于模型的策略迭代方法推广到了分布式时滞系统的线性二次最优控制问题(LQR)的求解,证明了由该迭代方法得到的性能指标是递减的,且控制器收敛于最优控制器。This paper extends the model-based policy iteration method to the ...
关键词:分布式时滞系统 最优控制 策略迭代 线性二次最优控制问题 
一类具有阶段结构生物经济系统的最优控制
《沈阳大学学报(自然科学版)》2025年第1期86-92,共7页张翼 赵佳琳 
国家自然科学青年基金资助项目(62103289)。
研究了具有阶段结构特征的食饵-捕食者系统模型的最优控制问题,通过稳定性分析探究了生物经济系统的平衡特性,提出了一种自适应动态规划算法,证明了该算法的收敛性。设计控制器使所构造性能指标(成本函数)达到最小,显著提高了生物经济...
关键词:阶段结构 生物经济系统 稳定性 最优控制 策略迭代 
基于策略迭代的脉冲系统最优控制
《系统科学与数学》2024年第11期3228-3238,共11页高洋 李媛 
国家自然科学基金项目(62103289)资助课题。
针对离散时间非线性系统的最优脉冲控制问题,提出了一种基于策略迭代(PI)的自适应动态规划(ADP)算法.首先引入脉冲区间集的约束条件,将系统转换为离散时间非线性脉冲控制系统,并根据哈密顿-雅可比-贝尔曼方程得到脉冲控制下的最优性能...
关键词:脉冲系统 策略迭代 最优控制 自适应动态规划 
创意数智化视域下AIGC介入文创产品营销策略迭代升级探析被引量:1
《美与时代(创意)(上)》2024年第11期119-122,共4页龚帅 
广东省教育厅2022年省级民办教育专项资金支持项目“‘材料学’学科提升工程”(M1221100)研究成果。
2022年,人工智能取得了突破性的发展,这一发展引领了生成式人工智能内容正式涉足多个行业领域。AIGC的引入为众多产业的生产和营销等关键环节带来了革命性的影响,其中包括了文化创意产业。本文聚焦于AIGC在文化创意产品营销及优化方面...
关键词:AIGC 文创 营销 数智化 大数据 
基于策略迭代的滑动自平衡偏置倒立摆自适应最优控制
《广州城市职业学院学报》2024年第3期85-89,共5页吴永恒 王永华 李明 温炜坚 
国家自然科学基金项目“基于信息几何的多维频谱感知和融合方法研究”(编号:61971147);2022年广东省研究生教育创新计划项目“面向智能制造行业人才需求的STEAM课程的建设的策略研究”(编号:2022JGXM052);2022年大思政课建设协同中心研究课题“双碳背景下工科行动模式、路径与人才培养研究”(编号:2022DSZK06);2023广东省普通高校产教融合创新平台项目“数字化智能工厂场景应用产教融合平台”(编号:2023CJPT011)。
针对具有未知参数的滑动自平衡偏置倒立摆系统,提出一种自适应控制方案,能够在线求解系统最优反馈增益,而不需要了解系统内部动态模型。基于策略迭代技术,所提出的算法在策略评估和策略更新步骤之间交替进行,直到控制策略的更新不再改...
关键词:倒立摆 策略迭代 自适应控制 
典籍文化传播策略迭代:从数字平面到元宇宙多维
《中学政治教学参考》2024年第24期51-54,共4页王鑫 李燕 
2023年天津市哲学社会科学规划项目“习近平总书记关于弘扬中华优秀传统文化的重要论述及其原创性贡献研究”(项目编号:TJKS23-010)阶段性成果
典籍文化传播是彰显新时代文化内核的重要手段。处在传播策略图景初代的典籍文化,在传播内容上存在热点缺失、传播途径上存在印象刻板问题,固化的传播策略难以构建清晰的、完整的传递图谱。元宇宙的引入,使媒介可以通过技术牵引产生对...
关键词:典籍文化 数字传播 传递图谱 元宇宙 智能服务 
窗口长度自适应调整的策略迭代最优控制
《控制理论与应用》2024年第4期745-750,共6页方欣 栾小丽 刘飞 
国家自然科学基金项目(61991402)资助.
在系统模型参数未知的最优控制问题中,策略迭代能否快速收敛到最优控制策略的关键在于值函数的估计.为了提升值函数的估计精度以及收敛速度,本文提出一种窗口长度自适应调整的策略迭代最优控制算法.充分利用一段时间内的历史样本数据,...
关键词:最优控制 策略迭代 窗口长度自适应调整 影响力函数 
基于航迹消除与策略迭代的无人机集群区域目标搜索方法
《指挥控制与仿真》2024年第1期37-43,共7页陈星 陈卓 杨博文 李翱翔 
重庆市自然科学基金项目(cstc2018jcyjAX0090);中国人民解放军陆军勤务学院重点资助项目(LQ-ZD-202302)。
无人机集群区域搜索在军事领域以及民用领域的搜救、巡逻、监测、环境勘测等方面有着广泛的应用,但如何保证不同场景下无人机集群搜索方法的效率问题依然是个难题。为了更好地解决搜索目标先验信息已知的无障碍区域内多无人机集群搜索...
关键词:无人机集群搜索 先验信息 航迹消除 策略迭代 动态规划 
基于马尔可夫决策过程的附加服务定价优化
《哈尔滨商业大学学报(自然科学版)》2024年第1期118-122,共5页杨明霞 朱星辉 
国家自然科学基金项目(U2033205);民航局安全能力专项(1007-IMH22004)。
随着民航运输业竞争日益加剧以及航空旅客个性化需求逐步提高,为取得差异化竞争优势和提高旅客满意度,开展附加服务业务是目前国内外航空公司关注的焦点,如何对附加服务定价以增加收益是目前航空公司运营的一个重要问题.为此基于马尔可...
关键词:航空运输 收益管理 附加服务 服务定价 马尔可夫决策过程 策略迭代 
检索报告 对象比较 聚类工具 使用帮助 返回顶部