多智能体协作

作品数:50被引量:113H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:方宝富王浩陈晋音杨东勇张健钦更多>>
相关机构:合肥工业大学南京邮电大学北京理工大学上海交通大学更多>>
相关期刊:《光盘技术》《中国科学:信息科学》《黑龙江科技大学学报》《浙江工业大学学报》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国防科技技术预先研究基金湖南省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
近端策略优化的城市环境多智能体协作对抗方法
《通信学报》2025年第3期94-108,共15页米广铭 张辉 张菁 卓力 
北京市自然科学基金资助项目(No.L247025)。
城市环境由于其地理空间的复杂性及动态变化性,往往会令指挥系统变得低效且短视。针对该问题,提出了一种近端策略优化城市环境的多智能体协作对抗方法。首先,在建立完善的城市对抗环境的基础上,使用近端策略优化的演员-评论员网络算法...
关键词:深度强化学习 多智能体 协作对抗 近端策略优化 城市环境 
开放环境下的协作多智能体强化学习进展
《中国科学:信息科学》2025年第2期217-268,共52页袁雷 张子谦 李立和 管聪 俞扬 
国家自然科学基金创新研究群体项目(批准号:61876077);江苏省自然科学基金(批准号:BK20243039,BK20241199)资助。
多智能体强化学习(multi-agent reinforcement learning, MARL)近年来获得广泛关注并在不同领域取得进展.其中,协作多智能体强化学习专注于训练智能体团队以协同完成单智能体难以应对的任务目标,在路径规划、无人驾驶、主动电压控制和...
关键词:强化学习 多智能体系统 多智能体协作 开放环境机器学习 开放环境多智能体协作 
改进MADDPG多智能体的方法
《黑龙江科技大学学报》2025年第1期160-165,172,共7页宁姗 赵秋多 丁毓龙 郭嘉承 
为研究多智能体深度确定性策略梯度算法(MADDPG)通过共享观察信息和历史经验解决多智能体环境不稳定的问题,通过改进多智能体深度确定性梯度算法MADDPG提出了IMMADDPG算法,分析改进网络结构更有效地降低环境不稳定性和值函数高估对策略...
关键词:深度强化学习 多智能体协作 多智能体竞争 中心化训练 去中心化执行 
大语言模型在审计领域的潜在应用与技术路径
《会计之友》2024年第24期2-9,共8页张莉 
教育部人文社科研究规划基金项目“基于大数据的上市公司舞弊风险画像与异常检测研究”(20YJAZH129);北京市社会科学基金规划项目-北京市教育委员会社科计划重点项目“基于大数据的京津冀大气污染防治跟踪审计模式研究”(SZ202011232024)。
大语言模型因其自然语言处理能力,在审计领域技术创新中引发争议。文章分析了大语言模型在审计知识智能问答、流程自动化和审计风险与异常检测等方面的机遇,并提出了具体技术方案:基于检索增强生成的知识交互技术,与外部知识库结合增强...
关键词:大语言模型 审计 检索增强生成 多智能体协作 
大模型时代软件测试技术方向与趋势
《金融电子化》2024年第21期74-76,共3页朱少民 
随着大语言模型(LLM)的发展,软件测试正经历着深刻变革,从传统的自动化测试向智能化方向演进。本文探讨了大模型时代软件测试的新范式、技术方向、实践应用及未来展望。首先,大模型可以认知物理世界,从而能够突破一直困扰智能化测试的...
关键词:软件测试 自动化测试 多智能体协作 智能化方向 智能化测试 语言模型 全生命周期 实践应用 
基于双视角建模的多智能体协作强化学习方法
《计算机学报》2024年第7期1582-1594,共13页刘全 施眉龙 黄志刚 张立华 
国家自然科学基金(62376179,62176175);新疆维吾尔自治区自然科学基金(2022D01A238);江苏高校优势学科建设工程资助项目资助.
在多智能体协作领域,强化学习算法通过共享智能体的局部信息来实现智能体间的协作.但共享协作机制极易引发过度协作问题,导致智能体忽视自身局部观测信息,丧失策略多样性,最终陷入低效协作的困境.为了解决该问题,本文提出基于双视角建...
关键词:深度强化学习 多智能体系统 多智能体协作 协作建模 对比学习 
基于多智能体近端策略优化的无人机城市高层消防被引量:1
《长春工业大学学报》2023年第6期552-562,共11页赵小虎 吴若诚 江涵立 
安徽省网络空间安全态势感知与评估重点实验室开放基金项目(CSSAE-2021-004)。
城市高层消防一直是具有挑战性的问题,利用无人机来执行消防任务是一个有效的解决方案。在这项工作中,我们将城市高层消防问题表述为一个部分可观测的马尔可夫决策过程(POMDP),并提出一种带有β-变分自动编码器(β-VAE)的多智能体近端...
关键词:无人机导航 深度强化学习 多智能体协作 
面向多智能体协作的注意力意图与交流学习方法被引量:4
《自动化学报》2023年第11期2311-2325,共15页俞文武 杨晓亚 李海昌 王瑞 胡晓惠 
国家重点研发计划(2019YFB1405100);国家自然科学基金(61802380,61802016)资助。
对于部分可观测环境下的多智能体交流协作任务,现有研究大多只利用了当前时刻的网络隐藏层信息,限制了信息的来源.研究如何使用团队奖励训练一组独立的策略以及如何提升独立策略的协同表现,提出多智能体注意力意图交流算法(Multi-agent ...
关键词:多智能体 强化学习 意图交流 注意力机制 
基于多智能体强化学习的协同目标分配被引量:4
《系统工程与电子技术》2023年第9期2793-2801,共9页马悦 吴琳 许霄 
针对传统方法难以适用于动态不确定环境下的大规模协同目标分配问题,提出一种基于多智能体强化学习的协同目标分配模型及训练方法。通过对相关概念和数学模型的描述,将协同目标分配转化为多智能体协作问题。聚焦于顶层分配策略的学习,...
关键词:协同目标分配 多智能体协作 强化学习 神经网络 Advantage Actor-Critic 
面向多智能体协作的环境探索与覆盖算法
《国外电子测量技术》2023年第8期80-86,共7页魏云博 陈阳泉 曹凯 高嵩 刘伟超 
陕西省科技厅重点研发计划项目(2022GY-238);陕西省技术创新引导项目(2022QFY01-16);陕西省重点产业链项目(2023-ZDLNY-61)资助。
针对未知环境下的多智能体覆盖探索问题,提出一种基于稀疏高斯过程回归的环境探索与覆盖方法。该方法利用多智能体在任务区域中的移动探索获取环境信息,并以稀疏高斯过程回归方法构建未知环境的密度函数模型,作为质心维诺划分算法的输...
关键词:多智能体 稀疏高斯过程回归 质心维诺划分 缓冲因子 
检索报告 对象比较 聚类工具 使用帮助 返回顶部