强化学习方法

作品数:126被引量:575H指数:13
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:程玉虎王雪松刘全李厚强周文罡更多>>
相关机构:清华大学中国科学技术大学南京大学浙江大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金江苏省自然科学基金江苏省高校自然科学研究项目中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机科学与探索x
条 记 录,以下是1-5
视图:
排序:
集成深度强化学习在股票指数投资组合优化中的应用分析被引量:1
《计算机科学与探索》2025年第1期237-244,共8页冀中 张文嘉 
基于集成深度强化学习的投资组合选择是当前量化金融领域的关键技术之一。然而,目前采用上一窗口阶段最优指标决定下一阶段代理的集成滚动窗口方法存在一定的滞后性。为了有效应对这一不足,提出了双层嵌套集成深度强化学习方法。该方法...
关键词:股票投资组合 交易策略 深度强化学习 双层嵌套集成深度强化学习方法 集成学习 
基于潜在状态分布GPT的离线多智能体强化学习方法
《计算机科学与探索》2024年第8期2169-2179,共11页盛蕾 陈希亮 赖俊 
国家自然科学基金(61806221)。
通过决策Transformer对基础模型进行离线预训练可以有效地解决在线多智能体强化学习采样效率低和可扩展性的问题,但这种生成预训练方法在个体奖励难以定义和数据集不能覆盖最优策略的多智能体任务中表现不佳。针对此问题,采用潜在状态...
关键词:离线多智能体强化学习 分布式学习 表示学习 大语言模型 
潜在空间中的策略搜索强化学习方法
《计算机科学与探索》2024年第4期1032-1046,共15页赵婷婷 王莹 孙威 陈亚瑞 王嫄 杨巨成 
国家自然科学基金(61976156);天津市企业科技特派员项目(20YDTPJC00560)。
策略搜索是深度强化学习领域中一种能够解决大规模连续状态空间和动作空间问题的高效学习方法,被广泛应用在现实问题中。然而,此类方法通常需要花费大量的学习样本和训练时间,且泛化能力较差,学到的策略模型难以泛化至环境中看似微小的...
关键词:无模型强化学习 策略模型 状态表示 动作表示 连续动作空间 策略搜索强化学习方法 
潜在空间中深度强化学习方法研究综述
《计算机科学与探索》2023年第9期2047-2074,共28页赵婷婷 孙威 陈亚瑞 王嫄 杨巨成 
国家自然科学基金(61976156);天津市企业科技特派员项目(20YDTPJC00560)。
深度强化学习(DRL)是实现通用人工智能的一种有效学习范式,已在一系列实际应用中取得了显著成果。然而,DRL存在泛化性能差、样本效率低等问题。基于深度神经网络的表示学习通过学习环境的底层结构,能够有效缓解上述问题。因此,基于潜在...
关键词:强化学习 深度学习 潜在空间 状态表示 动作表示 
结合对比预测的离线元强化学习方法被引量:1
《计算机科学与探索》2023年第8期1917-1927,共11页韩旭 吴锋 
国家自然科学基金(92048301)。
传统的强化学习算法与环境进行大量交互才能获取稳定的动作选择策略,且无法有效应对任务环境发生改变的情况,因此难以应用于实际问题。离线元强化学习通过使用包含多个任务的经验回放数据集进行离线策略学习,为复杂情况下智能体快速适...
关键词:深度强化学习 离线元强化学习 对比学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部