云南高校图书馆联盟文献共享服务平台- 检索结果

-

在结果中检索

检索结果分析

检索条件："关键词=动作掩码 "

共条记录，以下是1-1

发文量、被引量趋势图

全选清除导出

参考文献引证文献引用追踪

视图：

排序：

显示条数：

基于强化学习的人员轮休调度方法: 《计算机集成制造系统》2024年第10期3566-3577,共12页李甜甜陈德胜曹斌; 浙江省自然科学基金资助项目(LQ21F020019);浙江省重点研发计划资助项目(2022C01145)。; 针对传统调度方法求解效果差、效率低、轮休约束表达不准确的问题,首次提出一种基于强化学习的人员轮休调度方法。该方法将轮休调度过程构建为Markov决策过程,利用动作掩码方法实现轮休约束,通过深度Q网络(DQN)方法对轮休调度的策略进...; 关键词：轮休调度强化学习 MARKOV决策过程深度Q网络动作掩码

全选清除导出

共1页<1>

检索报告对象比较聚类工具使用帮助返回顶部