基于深度强化学习的干扰资源分配方法被引量：4

Jamming Resource Allocation Method Based on Deep Reinforcement Learning

作　　者：李健涛王轲昕刘凯张天贤 LI Jiantao;WANG Kexin;LIU Kai;ZHANG Tianxian(School of Information and Communication Engineering,University of Electronic Science and Technology of China,Chengdu Sichuan 611731,China)

机构地区：[1]电子科技大学信息与通信工程学院,四川成都611731

出　　处：《现代雷达》2023年第10期44-51,共8页Modern Radar

基　　金：国家自然科学基金资助面上项目(61971109);国防科技创新特区支持项目(重点项目);中央高校其本科研业务费资助项目(ZYGX2018J009)。

摘　　要：针对干扰机群掩护目标突防组网雷达场景下的干扰资源分配的问题,提出了一种基于深度强化学习的干扰资源分配方法。该文将干扰资源分配模型描述为一个马尔可夫决策过程,并提出了一种基于动作密钥编码的双延迟深度确定性策略梯度(AKE-TD3)网络训练算法,将混合整数优化问题转化为连续变量优化问题,解决了算法难以收敛的问题。仿真结果表明,文中所设计的干扰资源分配方法对组网雷达有更好的干扰效果,且稳定性更高,有效地提升了干扰机群的作战性能。A deep reinforcement learning-based jamming resource allocation method is proposed to address the problem of resource allocation of multi-jammer for jamming netted radar system to cover target penetration.The jamming resource allocation model is described as a Markov decision process,and an action key encoding based double-delayed deep deterministic policy gradient(AKE-TD3)network training algorithm is also proposed,which transforms the mixed-integer optimization problem into a continuous-variable optimization problem to improve the convergence of the algorithm.Simulation results show that the jamming resource allocation method proposed in the paper has better jamming effectiveness and stability for netted radar systems.This method significantly enhances the combat performance of multi-jammer.

关键词：组网雷达系统干扰资源分配马尔科夫决策过程深度强化学习动作密钥编码

分类号：TN972[电子电信—信号与信息处理]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于深度强化学习的干扰资源分配方法被引量：4

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于深度强化学习的干扰资源分配方法 被引量：4

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于深度强化学习的干扰资源分配方法被引量：4