云南高校图书馆联盟文献共享服务平台- 检索结果

检索结果分析

检索条件："关键词=代理目标函数 "

共条记录，以下是1-1

全选清除导出

视图：

排序：

显示条数：

基于样本优化的PPO算法在单路口信号控制的应用: 《计算机系统应用》2024年第6期161-168,共8页张国有张新武; 国家自然科学基金(62072325);山西省自然科学基金(202203021221145);太原科技大学科技创新基金(20212039);山西省基础研究计划(202103021224272)。; 优化交通信号的控制策略可以提高道路车辆通行效率,缓解交通拥堵.针对基于值函数的深度强化学习算法难以高效优化单路口信号控制策略的问题,构建了一种基于样本优化的近端策略优化(MPPO)算法的单路口信号控制方法,通过对传统PPO算法中...; 关键词：交通信号控制深度强化学习近端策略优化算法代理目标函数状态特征向量

全选清除导出

共1页<1>