张博

作品数:1被引量:1H指数:1
导出分析报告
供职机构:中国科学院沈阳自动化研究所更多>>
发文主题:激光诱导击穿光谱控制器时钟偏差以太网卡信噪比更多>>
发文领域:自动化与计算机技术电子电信机械工程更多>>
发文期刊:《计算机应用研究》更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-1
视图:
排序:
基于二阶价值梯度模型强化学习的工业过程控制方法被引量:1
《计算机应用研究》2024年第8期2434-2440,共7页张博 潘福成 周晓锋 李帅 
中国科学院沈阳自动化研究所基础研究计划资助项目(2022000346)。
为了实现对高延时、非线性和强耦合的复杂工业过程稳定准确的连续控制,提出了一种基于二阶价值梯度模型强化学习的控制方法。首先,该方法在模型训练过程中加入了状态价值函数的二阶梯度信息,具备更精确的函数逼近能力和更高的鲁棒性,学...
关键词:工业过程控制 模型强化学习 二阶价值梯度 状态价值函数 状态采样策略 
检索报告 对象比较 聚类工具 使用帮助 返回顶部