强化学习方法

作品数:126被引量:575H指数:13
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:程玉虎王雪松刘全李厚强周文罡更多>>
相关机构:清华大学中国科学技术大学南京大学浙江大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金江苏省自然科学基金江苏省高校自然科学研究项目中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机学报x
条 记 录,以下是1-5
视图:
排序:
基于双视角建模的多智能体协作强化学习方法
《计算机学报》2024年第7期1582-1594,共13页刘全 施眉龙 黄志刚 张立华 
国家自然科学基金(62376179,62176175);新疆维吾尔自治区自然科学基金(2022D01A238);江苏高校优势学科建设工程资助项目资助.
在多智能体协作领域,强化学习算法通过共享智能体的局部信息来实现智能体间的协作.但共享协作机制极易引发过度协作问题,导致智能体忽视自身局部观测信息,丧失策略多样性,最终陷入低效协作的困境.为了解决该问题,本文提出基于双视角建...
关键词:深度强化学习 多智能体系统 多智能体协作 协作建模 对比学习 
基于价值函数分解和通信学习机制的异构多智能体强化学习方法
《计算机学报》2024年第6期1304-1322,共19页杜威 丁世飞 郭丽丽 张健 丁玲 
国家自然科学基金项目(62276265,61976216)资助.
许多现实世界的系统可以被建模为多智能体系统,多智能体强化学习为开发这些系统提供了一种有效的方法,其中基于集中训练与分散执行范式的价值函数分解方法得到了广泛的研究.然而现有的价值分解方法一般缺乏通信机制,在处理需要通信学习...
关键词:价值函数分解 异构多智能体强化学习 通信机制 图神经网络 互信息 交通信号控制 
基于两阶段意图共享的多智能体强化学习方法被引量:2
《计算机学报》2023年第9期1820-1837,共18页吴俊锋 王文 汪亮 陶先平 胡昊 吴海军 
2018年度科技创新2030—“新一代人工智能”重大项目(批准号:2018AAA0102302)资助。
近年来,强化学习技术在连续决策问题上展现出了强大的能力,成为机器学习领域的一个重要分支.通过强化学习技术在多智能体系统下的发展和研究,多智能体强化学习技术有望成为群体智能行为涌现的关键技术手段,但在现阶段仍有诸多科学问题...
关键词:多智能体系统 深度强化学习 深度多智能体强化学习 通信 意图共享 协作 
结合进化算法的深度强化学习方法研究综述被引量:13
《计算机学报》2022年第7期1478-1499,共22页吕帅 龚晓宇 张正昊 韩帅 张峻伟 
国家重点研发计划(2017YFB1003103);国家自然科学基金(61763003);吉林省自然科学基金(20180101053JC)资助。
深度强化学习是目前机器学习领域中重要的研究分支之一,它可以通过直接与环境进行交互实现端到端的学习,对高维度和大规模的问题有着很好的解决能力.虽然深度强化学习已经取得了瞩目的成果,但其仍面临着对环境探索能力不足、鲁棒性差、...
关键词:强化学习 深度强化学习 进化算法 遗传算法 进化策略 
基于双深度网络的安全深度强化学习方法被引量:27
《计算机学报》2019年第8期1812-1826,共15页朱斐 吴文 伏玉琛 刘全 
国家自然科学基金项目(61303108,61373094,61772355);江苏省高校自然科学研究项目重大项目(17KJA520004);符号计算与知识工程教育部重点实验室(吉林大学)项目(93K172014K04);苏州市重点产业技术创新-前瞻性应用研究项目(SYG201804);高校省级重点实验室(苏州大学)项目(KJS1524);中国国家留学基金(201606920013)资助~~
深度强化学习利用深度学习感知环境信息,使用强化学习求解最优决策,是当前人工智能领域的主要研究热点之一.然而,大部分深度强化学习的工作未考虑安全问题,有些方法甚至特意加入带随机性质的探索来扩展采样的覆盖面,以期望获得更好的近...
关键词:强化学习 深度强化学习 深度Q网络 安全深度强化学习 安全人工智能 经验回放 
检索报告 对象比较 聚类工具 使用帮助 返回顶部