人工智能在工业自动化控制系统中的应用  

在线阅读下载全文

作  者:张瑞强 

机构地区:[1]河南联控信息技术有限公司,河南郑州450001

出  处:《中国新技术新产品》2024年第15期22-25,共4页New Technology & New Products of China

摘  要:在具有高延迟、非线性特性和强耦合性的复杂工业环境中,实现稳定而准确的连续控制面具有一定挑战。为了应对该问题,本文提出一种基于二阶价值梯度的强化学习模型的创新控制策略。该策略首次将状态价值函数的二阶梯度信息纳入模型训练,旨在利用更准确的函数近似提高学习迭代效率,并增强模型的鲁棒性。本文还引入一种高效的状态采样策略,以优化策略学习过程。基于OpenAI Gym平台和2种工业场景的仿真测试表明,与基于最大似然估计的传统模型相比,本文方法显著降低了环境模型的预测误差,提高了学习效率和控制性能,有效减少了控制过程中的振荡现象。

关 键 词:强化学习 二阶价值梯度 工业自动化 控制策略 

分 类 号:TP273[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象