基于Q-Learning的编队防空目标分配方法研究  

Research on Target Allocation Method of Formation Intelligent Air Defense Based on Q-Learning

在线阅读下载全文

作  者:李双霖 李琳 潘浩[1] 张修社[1] 韩春雷 LI Shuanglin;LI Lin;PAN Hao;ZHANG Xiushe;HAN Chunlei

机构地区:[1]中国电子科技集团公司第二十研究所,西安710068

出  处:《现代导航》2022年第3期207-211,共5页Modern Navigation

基  金:国防科技基础加强计划资助。

摘  要:研究了编队防空目标分配问题,采用马尔科夫决策模型描述了编队防空动态目标分配过程,构建了编队防空目标分配强化学习系统,描述了系统组成,给出了基于Q-Learning算法的模型求解方法,并对模型效果进行了仿真分析,证明了该模型的有效性。The target assignment of formation air defense is studied,markov decision model is used to describe the dynamic target assignment process of formation air defense,the formation air defense target allocation reinforcement learning system is constructed,the system composition is described,the model solving method based on Q-Learning algorithm is given,and the model affect is simulated and analyzed,which proves the effectiveness of the model.

关 键 词:编队防空 强化学习 Q-LEARNING 

分 类 号:TN966[电子电信—信号与信息处理]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象