一种训练深度神经网络进行强化学习的方法

A Method for Reinforcement Learning by Training Deep Neural Networks

作　　者：欧阳陈华[1] 魏书堤[1] 张汛 OUYANG Chen-hua;WEI Shu-di;ZHANG Xun(Hengyang Normal University,Hengyang 421008,China)

出　　处：《电脑与信息技术》2023年第1期8-10,共3页Computer and Information Technology

基　　金：湖南省教育厅科学研究项目(项目编号:20C0290);衡阳师范学院南岳学院教学改革研究项目(项目编号:NJY201908)。

摘　　要：深度强化学习是当前机器学习领域中一个非常重要的研究方向,它通过环境对学习的反馈交互从而实现端到端的学习,能够解决一些维度高且规模大的问题。深度强化学习已经取得了多项引入注目的成果,但其缺点是鲁棒性差、局部探索能力不强、梯度易受影响。化学反应算法能够快速实现全局搜索,易于并行实现,且具有良好的鲁棒性。因此,将化学反应优化算法应用于无模型的深度强化学习方法,实践证明有一定的加速效果。Deep reinforcement learning is a very important research direction in the current field of machine learning.It realizes end-to-end learning through the feedback interaction of the environment to learning,and can solve some high-dimensional and large-scale problems.Deep reinforcement learning has achieved many attractive results,but its disadvantages are poor robustness,weak local exploration ability,and susceptible gradients.The chemical reaction algorithm can quickly realize the global search,is easy to implement in parallel,and has good robustness.Therefore,applying the chemical reaction optimization algorithm to the model-free deep reinforcement learning method has been proved to have a certain acceleration effect.

关键词：强化学习 DQN CRO

分类号：TP181[自动化与计算机技术—控制理论与控制工程]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种训练深度神经网络进行强化学习的方法

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种训练深度神经网络进行强化学习的方法

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索