针对大规模复杂车流的PG强化交通灯控制算法  

PG enhanced traffic light control algorithm for large-scale complex traffic flow

在线阅读下载全文

作  者:张正 宫新保[1] ZHANG Zheng;GONG Xin-bao(Department of Electronic Engineering,Shanghai Jiaotong University,Shanghai 200240,China)

机构地区:[1]上海交通大学电子工程系,上海200240

出  处:《信息技术》2024年第6期168-173,186,共7页Information Technology

摘  要:优化城市道路中的交通信号灯控制是低成本地提升城市交通路网性能的方法之一。该研究提出了一种利用策略梯度(Policy Gradient, PG)强化调优的交通灯控制算法。该算法引入了道路压力项、旅程时间项和黑名单机制项,利用统计方式预测汽车行程轨迹,并采用策略梯度估计的优化算法调整算法中的参数。在数据挖掘国际会议Knowledge Discovery and Data Mining (KDD)组织的算法竞赛KDD Cup 2021城市大脑挑战赛中,获得了冠军的成绩。在该挑战赛提供的城市路网规模复杂车流仿真平台上的实验结果表明,算法具有应用于实际场景的价值。Optimizing traffic light control is one of the low cost methods to improve the performance of urban traffic network.This study proposes a traffic signal control algorithm using the Policy Gradient(PG)algorithm.The model of this algorithm introduces the road pressure term,the travel time term and the blacklist mechanism term,predicts the car travel trajectory statistically,and adjusts the parameters in the algorithm with the optimization algorithm of PG estimation.The algorithm won the KDD Cup 2021 City Brain Challenge organized by the Data Mining field international conference-Knowledge Discovery and Data Mining(KDD).The experiment results of the simulation platform which has city-scale road network with complex traffic flow provided by the challenge commission show that the algorithm has the value of application in practical scenarios.

关 键 词:交通灯控制 策略梯度 城市路网 强化学习 复杂车流 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象