分布式强化学习

作品数:20被引量:100H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:仲宇顾国昌窦春霞黄庆东张慧峰更多>>
相关机构:西北工业大学哈尔滨工程大学北京邮电大学东南大学更多>>
相关期刊:《电子器件》《控制工程》《软件工程》《软件工程与应用》更多>>
相关基金:国家自然科学基金武器装备预研基金国防基础科研计划中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于高斯混合模型的分布式强化学习算法鲁棒性优化
《软件工程》2024年第11期75-78,共4页毕霄昀 鲁广东 蔡霞 
当前,分布式强化学习假设所有智能体均能正常工作,但在实际情况中可能存在异常智能体。为此,提出了一种基于高斯混合模型的聚类方法,用于优化分布式强化学习算法。首先,计算智能体上传梯度对应的高斯分布概率。其次,根据高斯分布更新聚...
关键词:聚类算法 分布式强化学习 鲁棒性 
频分多址系统分布式强化学习功率控制方法
《计算机应用研究》2023年第12期3772-3777,共6页李烨 司轲 
华为技术有限公司合作资助项目(YBN2019115054)。
近年来,深度强化学习作为一种无模型的资源分配方法被用于解决无线网络中的同信道干扰问题。然而,基于常规经验回放策略的网络难以学习到有价值的经验,导致收敛速度较慢;而人工划定探索步长的方式没有考虑算法在每个训练周期上的学习情...
关键词:分布式强化学习 频分多址系统 功率控制 贪心策略 优先经验回放 动态步长调整 
基于分布式强化学习的车辆控制算法研究被引量:7
《汽车工程》2023年第9期1637-1645,共9页刘卫国 项志宇 刘伟平 齐道新 王子旭 
自动驾驶国家新一代人工智能开放创新平台项目(2020AAA0103702)资助。
端到端自动驾驶算法的开发现已成为当前自动驾驶技术研发的热点。经典的强化学习算法利用车辆状态、环境反馈等信息训练车辆行驶,通过试错学习获得最佳策略,实现了端到端的自动驾驶算法开发,但仍存在开发效率低下的问题。为解决虚拟仿...
关键词:强化学习 分布式 多智能体 自动驾驶 Carla 车辆控制 
面向多用户动态频谱接入的改进双深度Q网络方法研究被引量:2
《广东工业大学学报》2023年第4期85-93,共9页何一汕 王永华 万频 王磊 伍文韬 
国家自然科学基金资助项目(61971147)。
随着移动通信技术的飞速发展,有限的频谱利用资源与大量频谱通信需求之间的矛盾也日益加剧,需要新的智能方法来提高频谱利用率。本文提出了一种基于分布式优先经验池结合双深度Q网络的多用户动态频谱接入方法。通过该方法,次用户可以在...
关键词:动态频谱接入 分布式强化学习 优先经验池 深度强化学习 
计及需求灵活性的地区绿色证书、碳排放权及电力联合交易分析被引量:5
《电网技术》2023年第8期3164-3173,共10页李吉峰 邹楠 李卫东 吴俊 张明泽 
通过市场的导向作用,形成不同关联市场之间的合力,促成能源的清洁低碳转型是亟待解决的重要问题。针对当前电–碳–绿证联合市场方面的研究未针对市场参与主体构建可供量化分析的动力学模型,以及求解算法的智能性仍需进一步挖掘等问题,...
关键词:电力市场 绿色证书交易市场 碳排放权交易市场 需求灵活性 深度分布式强化学习 
基于分布式强化学习的功率控制算法研究
《软件工程与应用》2023年第3期530-542,共13页司轲 李烨 
强化学习作为一种无模型的控制方法被应用于解决蜂窝网络中的同信道干扰问题。然而,在基于值的强化学习算法中,函数逼近存在误差导致Q值被高估,使算法收敛至次优策略而对信道干扰的抑制性能不佳,且在高频带场景中收敛速度缓慢。对此提...
关键词:分布式强化学习 功率控制 Actor-Critic算法 双重深度Q网络 延迟深度确定性策略梯度 
面向执行-学习者的在线强化学习并行训练方法被引量:4
《计算机学报》2023年第2期229-243,共15页孙正伦 乔鹏 窦勇 李青青 李荣春 
国家自然科学基金(61732018、61902415、61972409);重点实验室开放基金(WDZC20205500104)资助。
近年来,深度强化学习(Deep Reinforcement Learning,DRL)已经成为了人工智能领域中的研究热点.为了加速DRL训练,人们提出了分布式强化学习方法用于提升训练速度.目前分布式强化学习可以分为同策略方法、异策略方法以及最新的近同策略方...
关键词:Gossip算法 强化学习 同策略学习 分布式强化学习 并行训练方法 
攻击角度约束下的分布式强化学习制导方法被引量:6
《宇航学报》2022年第8期1061-1069,共9页李博皓 安旭曼 杨晓飞 吴云洁 李国飞 
国家自然科学基金(62003021);中央高校基本科研业务项目(D5000210830)。
为提高导弹在攻击角度约束下对目标的打击效能,提出了一种基于深度确定性策略梯度算法的分布式强化学习制导策略。为了最大限度地减小攻击角度误差,设计了一种新的奖励函数,使导弹在满足视场角约束的同时,视线角向期望值收敛。此外,为...
关键词:导弹制导 强化学习 攻击角度 梯度算法 
基于深度分布式强化学习的电力系统分散协调调度方法被引量:4
《电子器件》2022年第4期947-953,共7页潮铸 段秦尉 钱峰 黄红伟 薛艳军 
针对风、光等可再生能源发电不断并入电力系统,配电网由被动逐渐转变为主动,由此需要主电网、主动配电网和微电网统一调度的问题,基于深度分布式强化学习方法,提出了电力系统分散协调的一体化调度方法。首先,基于传统经济调度模型,提出...
关键词:分布式 强化学习 分散协调 调度 电力系统 
分布式强化学习在经济调度问题中的应用被引量:2
《控制工程》2022年第3期480-485,共6页陈晓玉 周佳玲 
国家自然科学基金青年科学基金资助项目(62003167);江苏省自然科学基金青年基金资助项目(BK20180459)。
研究了智能电网中电力成本函数未知的多区域动态经济调度问题。该问题的目标是配置每个区域在每个时刻的最优发电和购电量,以最小化多个区域的电力成本之和。为了解决电力成本函数未知的多区域动态经济调度问题,提出了基于Q学习的分布...
关键词:分布式强化学习 智能电网 动态经济调度问题 一致性协议 
检索报告 对象比较 聚类工具 使用帮助 返回顶部