基于DQN的异构测控资源联合调度方法被引量：4

DQN-based Joint Scheduling Method of Heterogeneous TT&C Resources

作　　者：薛乃阳丁丹贾玉童王志强刘渊 Xue Naiyang;Ding Dan;Jia Yutong;Wang Zhiqiang;Liu Yuan(Graduate School,Space Engineering University,Beijing 101416,China;Department of Electronic and Optical Engineering,Space Engineering University,Beijing 101416,China;PLA 61646 Troops,Beijing 100192,China)

机构地区：[1]航天工程大学研究生院,北京101416 [2]航天工程大学电子与光学工程系,北京101416 [3]中国人民解放军61646部队,北京100192

出　　处：《系统仿真学报》2023年第2期423-434,共12页Journal of System Simulation

摘　　要：以异构测控网资源联合调度为研究对象,提出一种基于强化学习的深度Q网络(deep Q network, DQN)算法。在充分分析异构测控资源联合调度问题特点后,用数学语言对影响问题求解的约束条件进行描述,建立了资源联合调度模型;从应用强化学习解决问题的角度,对求解的问题进行马尔科夫决策过程描述后,分别设计了2个结构相同的神经网络和基于ε贪婪算法的动作选择策略,并建立了DQN求解框架。仿真结果表明:基于DQN的异构测控资源调度方法较遗传算法能够找到调度收益更优的测控调度方案。Joint scheduling of heterogeneous TT&C resources as research object, a deep Q network(DQN) algorithm based on reinforcement learning is proposed. The characteristics of the joint scheduling problem of heterogeneous TT&C resources being fully analyzied and mathematical language being used to describe the constraints affecting the solution, a resource joint scheduling model is established. From the perspective of applying reinforcement learning, two neural networks with the same structure and the action selection strategies based on ε greedy algorithm are respectively designed after Markov decision process description, and DQN solution framework is established. The simulation results show that DQNbased heterogeneous TT&C resources scheduling method can identify a TT&C scheduling scheme with better scheduling revenue than the genetic algorithm.

关键词：航天测控异构测控资源联合调度深度Q网络调度收益强化学习

分类号：TP273.1[自动化与计算机技术—检测技术与自动化装置]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于DQN的异构测控资源联合调度方法被引量：4

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于DQN的异构测控资源联合调度方法 被引量：4

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于DQN的异构测控资源联合调度方法被引量：4