云南高校图书馆联盟文献共享服务平台- 强化学习方法

公共卫生与预防医学

营养与食品卫生学

人体解剖和组织胚胎学

航空、航天与航海医学

影像医学与核医学

血液循环系统疾病

神经病学与精神病学

皮肤病学与性病学

微生物与生化药学

农业机械化工程

农业电气化与自动化

作物栽培与耕作技术

农业昆虫与害虫防治

木材科学与技术

特种经济动物饲养

材料科学与工程

矿井通风与安全

石油与天然气工程

油气田开发工程

冶金机械及自动化

金属切削加工及机床

机械设计及理论

机械制造及自动化

仪器科学与技术

精密仪器及机械

测试计量技术及仪器

兵器科学与技术

兵器发射理论与技术

武器系统与运用工程

火炮、自动武器与弹药工程

军事化学与烟火技术

动力工程及工程热物理

动力机械及工程

流体机械及工程

核燃料循环与材料

辐射防护及环境保护

电工理论与新技术

电力系统及自动化

高电压与绝缘技术

电力电子与电力传动

微电子学与固体电子学

信息与通信工程

通信与信息系统

信号与信息处理

自动化与计算机技术

控制科学与工程

控制理论与控制工程

检测技术与自动化装置

计算机科学与技术

计算机系统结构

计算机软件与理论

计算机应用技术

合成树脂塑料工业

轻工技术与工程

纺织科学与工程

纺织材料与纺织品设计

纺织化学与染整工程

服装设计与工程

食品科学与工程

粮食、油脂及植物蛋白工程

农产品加工及贮藏工程

水产品加工及贮藏工程

皮革化学与工程

建筑设计及理论

城市规划与设计

供热、供燃气、通风及空调工程

桥梁与隧道工程

水文学及水资源

水力学及河流动力学

道路与铁道工程

交通信息工程及控制

交通运输规划与管理

载运工具运用工程

船舶与海洋工程

船舶及航道工程

港口、海岸及近海工程

航空宇航科学技术

航空宇航推进理论与工程

航空宇航制造工程

人机与环境工程

环境科学与工程

概率论与数理统计

运筹学与控制论

一般力学与力学基础

热学与物质分子运动论

原子与分子物理

粒子物理与原子核物理

测绘科学与技术

大地测量学与测量工程

摄影测量与遥感

地图制图学与地理信息工程

固体地球物理学

大气科学及气象学

大气物理学与大气环境

古生物学与地层学

职业技术教育学

国际共产主义运动

宪法学与行政法学

环境与资源保护法学

马克思主义哲学

发展与教育心理学

考古学及博物馆学

时间限定

时间：

更新时间：

期刊范围

全部期刊核心期刊 EI来源期刊 SCI来源期刊 CAS来源期刊 CSCD来源期刊 CSSCI来源期刊

学科限定全选

强化学习方法: 作品数：126被引量：575H指数：13; 导出分析报告; 相关领域：自动化与计算机技术更多>>; 相关作者：程玉虎王雪松刘全李厚强周文罡更多>>; 相关机构：清华大学中国科学技术大学南京大学浙江大学更多>>; 相关期刊：更多>>; 相关基金：国家自然科学基金江苏省自然科学基金江苏省高校自然科学研究项目中央高校基本科研业务费专项资金更多>>

在结果中检索

检索结果分析

选择条件：

期刊=计算机学报

共条记录，以下是1-5

全选清除导出

参考文献引证文献引用追踪

视图：

排序：

基于双视角建模的多智能体协作强化学习方法: 《计算机学报》2024年第7期1582-1594,共13页刘全施眉龙黄志刚张立华; 国家自然科学基金(62376179,62176175);新疆维吾尔自治区自然科学基金(2022D01A238);江苏高校优势学科建设工程资助项目资助.; 在多智能体协作领域,强化学习算法通过共享智能体的局部信息来实现智能体间的协作.但共享协作机制极易引发过度协作问题,导致智能体忽视自身局部观测信息,丧失策略多样性,最终陷入低效协作的困境.为了解决该问题,本文提出基于双视角建...; 关键词：深度强化学习多智能体系统多智能体协作协作建模对比学习

基于价值函数分解和通信学习机制的异构多智能体强化学习方法: 《计算机学报》2024年第6期1304-1322,共19页杜威丁世飞郭丽丽张健丁玲; 国家自然科学基金项目(62276265,61976216)资助.; 许多现实世界的系统可以被建模为多智能体系统,多智能体强化学习为开发这些系统提供了一种有效的方法,其中基于集中训练与分散执行范式的价值函数分解方法得到了广泛的研究.然而现有的价值分解方法一般缺乏通信机制,在处理需要通信学习...; 关键词：价值函数分解异构多智能体强化学习通信机制图神经网络互信息交通信号控制

基于两阶段意图共享的多智能体强化学习方法被引量：2: 《计算机学报》2023年第9期1820-1837,共18页吴俊锋王文汪亮陶先平胡昊吴海军; 2018年度科技创新2030—“新一代人工智能”重大项目(批准号:2018AAA0102302)资助。; 近年来,强化学习技术在连续决策问题上展现出了强大的能力,成为机器学习领域的一个重要分支.通过强化学习技术在多智能体系统下的发展和研究,多智能体强化学习技术有望成为群体智能行为涌现的关键技术手段,但在现阶段仍有诸多科学问题...; 关键词：多智能体系统深度强化学习深度多智能体强化学习通信意图共享协作

结合进化算法的深度强化学习方法研究综述被引量：13: 《计算机学报》2022年第7期1478-1499,共22页吕帅龚晓宇张正昊韩帅张峻伟; 国家重点研发计划(2017YFB1003103);国家自然科学基金(61763003);吉林省自然科学基金(20180101053JC)资助。; 深度强化学习是目前机器学习领域中重要的研究分支之一,它可以通过直接与环境进行交互实现端到端的学习,对高维度和大规模的问题有着很好的解决能力.虽然深度强化学习已经取得了瞩目的成果,但其仍面临着对环境探索能力不足、鲁棒性差、...; 关键词：强化学习深度强化学习进化算法遗传算法进化策略

基于双深度网络的安全深度强化学习方法被引量：27: 《计算机学报》2019年第8期1812-1826,共15页朱斐吴文伏玉琛刘全; 国家自然科学基金项目(61303108,61373094,61772355);江苏省高校自然科学研究项目重大项目(17KJA520004);符号计算与知识工程教育部重点实验室(吉林大学)项目(93K172014K04);苏州市重点产业技术创新-前瞻性应用研究项目(SYG201804);高校省级重点实验室(苏州大学)项目(KJS1524);中国国家留学基金(201606920013)资助~~; 深度强化学习利用深度学习感知环境信息,使用强化学习求解最优决策,是当前人工智能领域的主要研究热点之一.然而,大部分深度强化学习的工作未考虑安全问题,有些方法甚至特意加入带随机性质的探索来扩展采样的覆盖面,以期望获得更好的近...; 关键词：强化学习深度强化学习深度Q网络安全深度强化学习安全人工智能经验回放

全选清除导出

共1页<1>

检索报告对象比较聚类工具使用帮助返回顶部

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

强化学习方法

检索结果分析

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

强化学习方法

检索结果分析

下载全文

用户登录

高级检索检索式检索