半马尔可夫决策过程

作品数:23被引量:120H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:唐昊周雷高阳程文娟马学森更多>>
相关机构:合肥工业大学江南大学南京大学西南交通大学更多>>
相关期刊:《模式识别与人工智能》《金陵科技学院学报》《计算机应用研究》《长春师范大学学报》更多>>
相关基金:国家自然科学基金安徽省自然科学基金教育部“新世纪优秀人才支持计划”国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 基金=苏州市科技计划项目(应用基础研究计划)x
条 记 录,以下是1-1
视图:
排序:
深度分层强化学习研究与发展被引量:9
《软件学报》2023年第2期733-760,共28页黄志刚 刘全 张立华 曹家庆 朱斐 
国家自然科学基金(61772355,61702055,61876217,62176175);江苏省高等学校自然科学研究重大项目(18KJA520011,17KJA520004);吉林大学符号计算与知识工程教育部重点实验室资助项目(93K172014K04,93K172017K18,93K172021K08);苏州市应用基础研究计划工业部分(SYG201422);江苏高校优势学科建设工程资助项目。
深度分层强化学习是深度强化学习领域的一个重要研究方向,它重点关注经典深度强化学习难以解决的稀疏奖励、顺序决策和弱迁移能力等问题.其核心思想在于:根据分层思想构建具有多层结构的强化学习策略,运用时序抽象表达方法组合时间细粒...
关键词:人工智能 强化学习 深度强化学习 半马尔可夫决策过程 深度分层强化学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部