基于元强化学习的防空作战任务分配方法研究

Air Defence Combat Task Assignment Method Based on Meta-reinforcement Learning

作　　者：马超[1,2] 赵敏睿王刚孙文[1,2] MA Chao;ZHAO Min-rui;WANG Gang;SUN Wen

出　　处：《军事运筹与评估》2025年第1期53-59,共7页Military Operations Research and Assessments

基　　金：国家自然科学青年基金项目(62106283,72001214)。

摘　　要：针对防空作战任务分配中深度强化学习策略初始化难度大、环境敏感性强的问题,提出一种基于改进元权值的多智能体深度确定性策略梯度算法,采用混合优先级经验重放机制提升样本利用率,基于模型无关元学习框架,设计动态梯度加权方法优化元知识迁移能力,实现跨场景策略泛化。仿真算例表明所提算法收敛速度和任务成功率均优于传统方法,可为跨场景决策与快速策略生成提供新思路。

关键词：元学习深度强化学习防空反导任务分配

分类号：E911[军事] TP391.77[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于元强化学习的防空作战任务分配方法研究

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于元强化学习的防空作战任务分配方法研究

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索