-

检索结果分析

结果分析中...
检索条件:"关键词=动作掩码 "
条 记 录,以下是1-1
视图:
排序:
显示条数:
基于强化学习的人员轮休调度方法
《计算机集成制造系统》2024年第10期3566-3577,共12页李甜甜 陈德胜 曹斌 
浙江省自然科学基金资助项目(LQ21F020019);浙江省重点研发计划资助项目(2022C01145)。
针对传统调度方法求解效果差、效率低、轮休约束表达不准确的问题,首次提出一种基于强化学习的人员轮休调度方法。该方法将轮休调度过程构建为Markov决策过程,利用动作掩码方法实现轮休约束,通过深度Q网络(DQN)方法对轮休调度的策略进...
关键词:轮休调度 强化学习 MARKOV决策过程 深度Q网络 动作掩码 
检索报告 对象比较 聚类工具 使用帮助 返回顶部