情景问题

作品数:94被引量:70H指数:5
导出分析报告
相关领域:文化科学更多>>
相关作者:孙晓天金逊蔡宏王德明吴慧军更多>>
相关机构:中央民族大学首都医科大学附属北京友谊医院安徽省临泉第一中学苏州大学更多>>
相关期刊:更多>>
相关基金:江西省高等学校教学改革研究课题博士科研启动基金上海市“科技创新行动计划”项目河北省教育科学'十一五'规划课题更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 基金=上海市“科技创新行动计划”项目x
条 记 录,以下是1-1
视图:
排序:
基于强化学习的交通情景问题决策优化被引量:1
《计算机应用》2022年第8期2361-2368,共8页罗飞 白梦伟 
上海市2020年度“科技创新行动计划”项目(20DZ1201400,20YF1410900)。
在复杂交通情景中求解出租车路径规划决策问题和交通信号灯控制问题时,传统强化学习算法在收敛速度和求解精度上存在局限性;因此提出一种改进的强化学习算法求解该类问题。首先,通过优化的贝尔曼公式和快速Q学习(SQL)机制,以及引入经验...
关键词:强化学习 交通情景 经验池 马尔可夫决策过程 决策优化 
检索报告 对象比较 聚类工具 使用帮助 返回顶部