基于元强化学习的防空作战任务分配方法研究  

Air Defence Combat Task Assignment Method Based on Meta-reinforcement Learning

在线阅读下载全文

作  者:马超[1,2] 赵敏睿 王刚 孙文[1,2] MA Chao;ZHAO Min-rui;WANG Gang;SUN Wen

机构地区:[1]空军工程大学 [2]空防系统分析与工程国家级重点实验室

出  处:《军事运筹与评估》2025年第1期53-59,共7页Military Operations Research and Assessments

基  金:国家自然科学青年基金项目(62106283,72001214)。

摘  要:针对防空作战任务分配中深度强化学习策略初始化难度大、环境敏感性强的问题,提出一种基于改进元权值的多智能体深度确定性策略梯度算法,采用混合优先级经验重放机制提升样本利用率,基于模型无关元学习框架,设计动态梯度加权方法优化元知识迁移能力,实现跨场景策略泛化。仿真算例表明所提算法收敛速度和任务成功率均优于传统方法,可为跨场景决策与快速策略生成提供新思路。

关 键 词:元学习 深度强化学习 防空反导 任务分配 

分 类 号:E911[军事] TP391.77[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象