检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李双霖 李琳 潘浩[1] 张修社[1] 韩春雷 LI Shuanglin;LI Lin;PAN Hao;ZHANG Xiushe;HAN Chunlei
机构地区:[1]中国电子科技集团公司第二十研究所,西安710068
出 处:《现代导航》2022年第3期207-211,共5页Modern Navigation
基 金:国防科技基础加强计划资助。
摘 要:研究了编队防空目标分配问题,采用马尔科夫决策模型描述了编队防空动态目标分配过程,构建了编队防空目标分配强化学习系统,描述了系统组成,给出了基于Q-Learning算法的模型求解方法,并对模型效果进行了仿真分析,证明了该模型的有效性。The target assignment of formation air defense is studied,markov decision model is used to describe the dynamic target assignment process of formation air defense,the formation air defense target allocation reinforcement learning system is constructed,the system composition is described,the model solving method based on Q-Learning algorithm is given,and the model affect is simulated and analyzed,which proves the effectiveness of the model.
关 键 词:编队防空 强化学习 Q-LEARNING
分 类 号:TN966[电子电信—信号与信息处理]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7