强化学习方法

作品数:126被引量:575H指数:13
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:程玉虎王雪松刘全李厚强周文罡更多>>
相关机构:清华大学中国科学技术大学南京大学浙江大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金江苏省自然科学基金江苏省高校自然科学研究项目中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机应用研究x
条 记 录,以下是1-4
视图:
排序:
基于改进好奇心的深度强化学习方法
《计算机应用研究》2024年第9期2635-2640,共6页乔和 李增辉 刘春 胡嗣栋 
国家自然科学基金资助项目(51604141,51204087)。
在深度强化学习方法中,针对内在好奇心模块(intrinsic curiosity model,ICM)指导智能体在稀疏奖励环境中获得未知策略学习的机会,但好奇心奖励是一个状态差异值,会使智能体过度关注于对新状态的探索,进而出现盲目探索的问题,提出了一种...
关键词:深度强化学习 知识蒸馏 近端策略优化 稀疏奖励 内在好奇心 
基于PPO算法的自动驾驶人机交互式强化学习方法被引量:2
《计算机应用研究》2024年第9期2732-2736,共5页时高松 赵清海 董鑫 贺家豪 刘佳源 
国家自然科学基金资助项目(52175236)。
针对当前自动驾驶领域中深度强化学习(deep reinforcement learning,DRL)所面临的高计算性能需求和收敛速度慢的问题,将变分自编码器(variational autoencoder,VAE)和近端策略优化算法(proximal policy optimization,PPO)相结合。通过采...
关键词:自动驾驶 深度强化学习 特征编码 驾驶干预 经验回放 
基于图嵌入编码形态信息的非均匀多任务强化学习方法
《计算机应用研究》2024年第4期1022-1028,共7页贺晓 王文学 
国家自然科学基金资助项目(U1908215);辽宁省“兴辽英才计划”资助项目(XLYC2002014)。
传统强化学习方法存在效率低下、泛化性能差、策略模型不可迁移的问题。针对此问题,提出了一种非均匀多任务强化学习方法,通过学习多个强化任务提升效率和泛化性能,将智能体形态构建为图,利用图神经网络能处理任意连接和大小的图来解决...
关键词:多任务强化学习 图神经网络 变分图自编码器 形态信息编码 迁移学习 
基于组合训练的规则嵌入多智能体强化学习方法被引量:3
《计算机应用研究》2022年第3期802-806,共5页李渊 徐新海 
国家青年科学基金资助项目。
多智能体强化学习方法在仿真模拟、游戏对抗、推荐系统等许多方面取得了突出的进展。然而,现实世界的复杂问题使得强化学习方法存在无效探索多、训练速度慢、学习能力难以持续提升等问题。该研究嵌入规则的多智能体强化学习技术,提出基...
关键词:多智能体强化学习 嵌入规则 规则选择模型 组合训练 
检索报告 对象比较 聚类工具 使用帮助 返回顶部