云南高校图书馆联盟文献共享服务平台- 强化学习算法

强化学习算法: 作品数：313被引量：809H指数：13; 导出分析报告; 相关领域：自动化与计算机技术更多>>; 相关作者：俞扬周志华钱丽萍黄亮吴远更多>>; 相关机构：东南大学北京邮电大学清华大学电子科技大学更多>>; 相关期刊：更多>>; 相关基金：国家自然科学基金中央高校基本科研业务费专项资金国家重点基础研究发展计划国家高技术研究发展计划更多>>

-

在结果中检索

检索结果分析

结果分析中...

选择条件：

期刊=计算机系统应用

共条记录，以下是1-4

全选清除导出

参考文献引证文献引用追踪

视图：

排序：

基于BN-DDPG轻量级强化学习算法的智能兵棋推演被引量：1: 《计算机系统应用》2023年第4期293-299,共7页李卓远张德平; 国防基础科研基金(JCKY2020605C003)。; 兵棋推演与智能算法融合成为当前军事应用领域的研究热点,利用深度强化学习技术实现仿真推演中决策过程的智能化,可显著减少人为经验对决策过程的影响,提高推演效率和灵活性.现有基于DRL算法的决策模型,其训练时间过长,算力开销过大,无...; 关键词：智能推演深度强化学习二值神经网络自主决策

基于强化学习算法的智能飞控开发系统被引量：3: 《计算机系统应用》2022年第7期93-98,共6页罗杰董志岩翟鹏张立华; 广东省基础与应用基础研究基金(2019A1515110352);季华实验室开放课题(X190021TB194);科技创新2025重大专项(2020Z073)。; 无人机控制器的设计开发是一项复杂的系统工程,传统的基于代码编程的开发方式存在开发难度大、周期长及错误率高等缺点.同时,强化学习智能飞控算法虽在仿真中取得很好的性能,但在实际中仍缺乏一套完备的开发系统.本文提出一套基于模型...; 关键词：无人机强化学习智能控制基于模式设计开发系统航迹规划

基于值分布的多智能体分布式深度强化学习算法被引量：3: 《计算机系统应用》2022年第1期145-151,共7页陈妙云王雷盛捷; 中国科学技术大学预研基金(YZ2101900004)。; 近年来深度强化学习在一系列顺序决策问题中取得了巨大的成功,使其为复杂高维的多智能体系统提供有效优化的决策策略成为可能.然而在复杂的多智能体场景中,现有的多智能体深度强化学习算法不仅收敛速度慢,而且算法的稳定性无法保证.本...; 关键词：多智能体深度强化学习值分布多步回报分布式数据生成

应用强化学习算法求解置换流水车间调度问题被引量：12: 《计算机系统应用》2019年第12期195-199,共5页张东阳叶春明; 国家自然科学基金(71840003);上海理工大学科技发展项目(2018KJFZ043)~~; 面对日益增长的大规模调度问题,新型算法的开发越显重要.针对置换流水车间调度问题,提出了一种基于强化学习Q-Learning调度算法.通过引入状态变量和行为变量,将组合优化的排序问题转换成序贯决策问题,来解决置换流水车间调度问题.采用...; 关键词：置换流水车间调度强化学习 Q-LEARNING 最大完工时间

全选清除导出

共1页<1>

检索报告对象比较聚类工具使用帮助返回顶部