-

检索结果分析

结果分析中...
检索条件:"关键词=代理目标函数 "
条 记 录,以下是1-1
视图:
排序:
显示条数:
基于样本优化的PPO算法在单路口信号控制的应用
《计算机系统应用》2024年第6期161-168,共8页张国有 张新武 
国家自然科学基金(62072325);山西省自然科学基金(202203021221145);太原科技大学科技创新基金(20212039);山西省基础研究计划(202103021224272)。
优化交通信号的控制策略可以提高道路车辆通行效率,缓解交通拥堵.针对基于值函数的深度强化学习算法难以高效优化单路口信号控制策略的问题,构建了一种基于样本优化的近端策略优化(MPPO)算法的单路口信号控制方法,通过对传统PPO算法中...
关键词:交通信号控制 深度强化学习 近端策略优化算法 代理目标函数 状态特征向量 
检索报告 对象比较 聚类工具 使用帮助 返回顶部