强化学习算法

作品数:313被引量:809H指数:13
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:俞扬周志华钱丽萍黄亮吴远更多>>
相关机构:东南大学北京邮电大学清华大学电子科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金国家重点基础研究发展计划国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机系统应用x
条 记 录,以下是1-4
视图:
排序:
基于BN-DDPG轻量级强化学习算法的智能兵棋推演被引量:1
《计算机系统应用》2023年第4期293-299,共7页李卓远 张德平 
国防基础科研基金(JCKY2020605C003)。
兵棋推演与智能算法融合成为当前军事应用领域的研究热点,利用深度强化学习技术实现仿真推演中决策过程的智能化,可显著减少人为经验对决策过程的影响,提高推演效率和灵活性.现有基于DRL算法的决策模型,其训练时间过长,算力开销过大,无...
关键词:智能推演 深度强化学习 二值神经网络 自主决策 
基于强化学习算法的智能飞控开发系统被引量:3
《计算机系统应用》2022年第7期93-98,共6页罗杰 董志岩 翟鹏 张立华 
广东省基础与应用基础研究基金(2019A1515110352);季华实验室开放课题(X190021TB194);科技创新2025重大专项(2020Z073)。
无人机控制器的设计开发是一项复杂的系统工程,传统的基于代码编程的开发方式存在开发难度大、周期长及错误率高等缺点.同时,强化学习智能飞控算法虽在仿真中取得很好的性能,但在实际中仍缺乏一套完备的开发系统.本文提出一套基于模型...
关键词:无人机 强化学习 智能控制 基于模式设计 开发系统 航迹规划 
基于值分布的多智能体分布式深度强化学习算法被引量:3
《计算机系统应用》2022年第1期145-151,共7页陈妙云 王雷 盛捷 
中国科学技术大学预研基金(YZ2101900004)。
近年来深度强化学习在一系列顺序决策问题中取得了巨大的成功,使其为复杂高维的多智能体系统提供有效优化的决策策略成为可能.然而在复杂的多智能体场景中,现有的多智能体深度强化学习算法不仅收敛速度慢,而且算法的稳定性无法保证.本...
关键词:多智能体 深度强化学习 值分布 多步回报 分布式数据生成 
应用强化学习算法求解置换流水车间调度问题被引量:12
《计算机系统应用》2019年第12期195-199,共5页张东阳 叶春明 
国家自然科学基金(71840003);上海理工大学科技发展项目(2018KJFZ043)~~
面对日益增长的大规模调度问题,新型算法的开发越显重要.针对置换流水车间调度问题,提出了一种基于强化学习Q-Learning调度算法.通过引入状态变量和行为变量,将组合优化的排序问题转换成序贯决策问题,来解决置换流水车间调度问题.采用...
关键词:置换流水车间调度 强化学习 Q-LEARNING 最大完工时间 
检索报告 对象比较 聚类工具 使用帮助 返回顶部