多智能体强化学习

作品数:266被引量:857H指数:16
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:张一晋李骏俞扬熊盛武郑皎凌更多>>
相关机构:北京邮电大学东南大学电子科技大学哈尔滨工业大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金中国航空科学基金中国人民解放军总装备部预研基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
车辆边缘计算中基于MATD3的任务计算卸载策略
《福建师范大学学报(自然科学版)》2025年第3期27-37,共11页王洪滔 林兵 卢宇 陈乔鑫 李婵 
国家自然科学基金项目(62072108);福建省社会科学基地重大项目(FJ2022MJDZ019);福建省高校物理学学科联盟教学改革项目(FJPHYS-2022-B02);福建省科技经济融合服务平台项目(2023XRH001);福厦泉国家自主创新示范区协同创新平台项目(2022FX5);福建省高校产学合作资助项目(2022H6024、2021H6026)。
车辆边缘计算(vehicular edge computing,VEC)作为一种新兴的范式,通过将计算密集型、延迟敏感的新型车辆应用卸载到移动边缘计算(mobile edge computing,MEC)服务器上而受到关注,然而在动态变化的VEC环境中执行计算卸载面临着一个关键...
关键词:车辆边缘计算 计算卸载 深度强化学习 多智能体强化学习 
空天地一体化算力网络资源调度机制
《计算机工程》2025年第5期52-61,共10页王克文 张维庭 孙童 
国家自然科学基金(62201029,62394321);中国博士后科学基金(2022M710007,BX20220029)。
为满足卫星数据处理、车辆远程控制等快速响应和大范围覆盖的应用场景需求,聚焦于采用分层控制和人工智能技术的方法,设计一种空天地一体化算力网络资源调度机制。将空天地网络划分为3个域,分别部署域控制器,负责本地域的资源管理,同时...
关键词:空天地一体化网络 算力网络 任务调度 资源分配 多智能体强化学习 
基于多智能体强化学习的反应堆功率协调控制方法研究
《核动力工程》2025年第2期186-192,共7页牛振锋 李桐 李江宽 刘永超 吕为 谭思超 田瑞峰 
国家自然科学基金(12405200);中央高校基本科研业务费(3072024CFJ1501);黑龙江省省属本科高校“优秀青年教师基础研究支持计划”(KY11500240018)。
为提高核电厂反应堆功率与蒸汽发生器水位的协调控制精度,本研究提出了一种基于双延迟深度确定性策略梯度(TD3)算法的多智能体强化学习协调控制框架,在该框架中,不同子任务被分配给相应的智能体,各智能体相互配合以准确协调反应堆功率...
关键词:RELAP5协调控制 反应堆功率控制 蒸汽发生器水位控制 多智能体强化学习 双延迟深度确定性策略梯度(TD3) 
基于条件生成对抗网络与多智能体强化学习的配电网可靠性评估方法
《中国电力》2025年第4期230-236,共7页徐慧慧 田云飞 赵宇洋 彭婧 石庆鑫 成锐 
国家自然科学基金资助项目(52307094);国网甘肃省电力公司咨询项目(W24FZ2730050)。
在大规模分布式光伏接入场景下,为提升配电网可靠性评估的计算效率和精度,提出一种基于条件生成对抗网络与多智能体强化学习的评估方法。首先,采用序贯蒙特卡洛模拟生成系统的时序状态序列,并结合条件生成对抗网络与多分辨率气象因素,...
关键词:配电网 可靠性评估 生成对抗网络 
基于尾流加速估计与强化学习的风机偏航优化方法
《可再生能源》2025年第4期484-490,共7页陈玥 刘洋 陆秋瑜 谢平平 丁俐夫 
南方电网公司科技项目资助[项目编号:036000KK52222044(GDKJXM20222430)]。
随着新能源发电扩容及海上风电的兴起,风电场控制愈发关键。文章聚焦尾流效应模型优化与风电场智能化控制,通过改进Gaussian FLORIDyn模型的尾流估算,借助区域剪枝加速算法,在确保精确度的前提下提升仿真速度。此外,文章提出了一种图卷...
关键词:偏航优化 尾流估计 高斯FLORIDyn 多智能体强化学习 高性能仿真 
一种基于MAMFSAC的认知无蜂窝系统功率分配方法
《舰船电子对抗》2025年第2期30-36,共7页曹超 
随着移动通信技术的发展,通信业务需求增加,无蜂窝网络陷入频谱资源短缺的问题。为解决该问题,通过将认知技术引入到无蜂窝网络形成认知无蜂窝系统,次级无蜂窝网络可以利用频谱感知手段接入主级网络频谱,从而实现自身传输。然而现有的...
关键词:认知无蜂窝系统 多智能体强化学习 平均场 功率分配 
基于多智能体强化学习的电-碳-绿证耦合市场下多市场主体行为研究
《中国电力》2025年第4期44-55,共12页周飞航 王灏 王海利 王萌 金耀杰 李重春 张忠德 王鹏 
内蒙古电力交易中心科技项目(电碳市场耦合机理及内蒙古电力交易机制深化研究,DLJY-GKCG-2024-SCJYYB-0401-0013)。
建立全国碳排放权交易市场和绿证市场是中国实现“双碳”目标的重要策略之一。然而,现有研究多从经济角度分析市场耦合关系,忽视了电力网络的物理约束以及新能源出力不确定性对市场协同优化的影响,且没有考虑电力用户进入碳市场的情况...
关键词:碳排放权交易市场 绿证市场 耦合市场双层优化模型 多智能体强化学习 线路阻塞 碳证抵消机制 
随机环境下惩罚对团队成员道德风险行为的影响
《昆明理工大学学报(自然科学版)》2025年第2期188-202,共15页平安 张悟移 
国家自然科学基金重点项目(11931015);国家自然科学基金面上项目(7216403);国家自然科学基金地区项目(12271471,12461005,62462064);中国工程院院地合作重点项目(2020YNZH);云南省基础研究计划项目(202301AU070084,202301AT070419).
团队是当今组织的核心工作特征,通过惩罚等机制提高团队成员的合作意愿是提高团队绩效的主要手段.但现实环境中个体会综合考虑自身的综合收益进行决策.由于信息不对称难以消除,惩罚等机制有可能产生反效果.基于公共物品博弈和多智能体...
关键词:惩罚机制 团队成员 道德风险行为 多智能体强化学习 公共物品博弈模型 
基于图神经网络的多智能体强化学习对抗策略检测算法
《计算机与现代化》2025年第4期42-49,共8页孙启宁 桂智明 刘艳芳 范鑫鑫 路云峰 
复杂关键软件全国重点实验室自主课题(SKLSDE-2023ZX-17)。
在多智能体环境中,强化学习模型在应对对抗攻击方面存在安全漏洞,容易遭受对抗攻击。其中基于对抗策略的对抗攻击由于不直接修改受害者的观测,对其进行防御的难度更大。为解决这一问题,本文提出一种基于图神经网络的对抗策略检测算法,...
关键词:强化学习 多智能体系统 对抗攻击 对抗检测 图神经网络 
基于优势函数输入扰动的多无人艇协同策略优化方法
《自动化学报》2025年第4期824-834,共11页任璐 柯亚男 柳文章 穆朝絮 孙长银 
国家自然科学基金(62303009)资助。
多无人艇(Multiple unmanned surface vehicles,Multi-USVs)协同导航对于实现高效的海上作业至关重要,而如何在开放未知海域处理多艇之间复杂的协作关系、实现多艇自主协同决策是当前亟待解决的难题.近年来,多智能体强化学习(Multi-agen...
关键词:多无人艇协同 近端策略优化 多智能体强化学习 输入扰动 
检索报告 对象比较 聚类工具 使用帮助 返回顶部