检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:林雕 朱燕 杨剑 LIN Diao;ZHU Yan;YANG Jian(Army Command College,Nanjing 210045,China;Unit 61175 of PLA,Nanjing 210046,China;Information Engineering University,Zhengzhou 450052,China)
机构地区:[1]陆军指挥学院,南京210045 [2]解放军61175部队,南京210046 [3]信息工程大学,郑州450052
出 处:《火力与指挥控制》2024年第2期138-143,共6页Fire Control & Command Control
摘 要:面向毁伤和目标价值动态变化条件下的大规模武器目标动态分配问题,提出了一种基于深度强化学习的武器目标分配求解方法。该方法采用双神经网络结构,基于武器目标分配目标函数设计了一套简单、直观的状态与奖励建模方法。通过仿真实验对所提方法进行了验证,结果表明,所提方法能够较快实现收敛,且整体毁伤和计算效率上优于基于粒子群的方法。所提方法能够有效应对毁伤概率和目标价值动态变化条件下的武器目标分配问题,说明了其良好的拓展性。该方法可应用于作战任务规划、仿真单元自动交火等场景下的武器目标分配快速求解。The paper proposed a deep Q-learning method to solve the weapon target assignment problem with dynamic damage rates and target values.The DQN method adopted a double network structure.A straightforward method is proposed for modeling the state and reward function of the DQN,which is designed based on the objective function of the weapon target assignment problem.The proposed DQN model was tested by using several simulated scenarios.Results showed the model can converge fast and effectively solve the weapon target assignment problem with dynamic damage rates and target values.The proposed method achieved a better total damage rate and less computation time than the particle swarm-based method.The proposed method can be applied to weapon target assignment problem under the scenario of combat mission planning and combat simulation.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38