基于强化学习的最优控制指令模仿生成方法被引量：1

Imitative Generation of Optimal Guidance Law Based on Reinforcement Learning

作　　者：贾政轩林廷宇肖莹莹施国强王豪[2] 曾贲欧一鸣赵芃芃 Jia Zhengxuan;Lin Tingyu;Xiao Yingying;Shi Guoqiang;Wang Hao;Zeng Bi;Ou Yiming;Zhao Pengpeng(Beijing Simulation Center,Beijing 100854,China;Beijing Institute of Electronic System Engineering,Beijing 100854,China)

机构地区：[1]北京仿真中心,北京100854 [2]北京电子工程总体研究所,北京100854

出　　处：《系统仿真学报》2023年第11期2410-2418,共9页Journal of System Simulation

摘　　要：以高速机动目标拦截为问题背景,基于深度强化学习提出了一种不依赖目标加速度估计的逆轨拦截最优控制指令生成方法,并通过仿真实验进行了有效性验证。从仿真实验结果看,提出的方法实现了三维空间高速机动目标逆轨拦截并大幅削减了对带有强不确定性目标估计的要求,相比最优控制方法具有更强的适用性。Under the background of high-speed maneuvering target interception,an optimal guidance law generation method for head-on interception independent of target acceleration estimation is proposed based on deep reinforcement learning.In addition,its effectiveness is verified through simulation experiments.As the simulation results suggest,the proposed method successfully achieves head-on interception of high-speed maneuvering targets in 3D space and largely reduces the requirement for target estimation with strong uncertainty,and it is more applicable than the optimal control method.

关键词：强化学习最优制导模仿学习逆轨拦截制导控制

分类号：TP391.9[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于强化学习的最优控制指令模仿生成方法被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于强化学习的最优控制指令模仿生成方法 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于强化学习的最优控制指令模仿生成方法被引量：1