检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北方工业大学电气与控制工程学院交通设备与控制工程系,北京100144 [2]中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190 [3]中国科学院大学人工智能学院,北京100049
出 处:《工业控制计算机》2020年第10期16-19,22,共5页Industrial Control Computer
基 金:2019年北京高等学校高水平人才交叉培养计划;北京市基本科研业务费(110052971921/023);校内人才(213051360020XN173/013)。
摘 要:深度强化学习能为交通信号控制研究带来诸多优化空间,它能够实现Agent与道路交通环境之间的交互,根据获得的惩罚或奖励不断地学习知识,从而更加适应环境。研究主要是基于深度强化学习和SUMO仿真的方法,以从仿真的方式建立的智能网联车辆环境中得到单路口交通实时动态信息,并从中输出深度Q网络(DQN)算法所需要的重要参数。基于搭建的深度神经网络,通过不断优化它的权重参数来提高性能,进一步实现对单路口交通信号控制方案的优化,并最终探索一个能够通过自主学习来高效控制单路口交通的信号控制方案。Deep reinforcement learning can bring a lot of optimization space for traffic signal control research. It can realize the interaction between agent and road traffic environment,and continuously learn knowledge according to the punishment or reward obtained,so as to adapt to the environment more.The research of this paper is mainly based on deep reinforcement learning and SUMO simulation method to obtain the real-time traffic dynamic information of single intersection from the intelligent network connected vehicle environment established by simulation,and output the important parameters required by the DQN algorithm. Based on the constructed deep neural network,the performance is improved by continuously optimizing its weight parameters,further realizing the optimization of single intersection traffic signal control scheme,and finally exploring a signal control scheme which can effectively control the traffic of single intersection through autonomous learning.
关 键 词:深度强化学习 DQN算法 SUMO仿真 信号控制策略
分 类 号:U491.54[交通运输工程—交通运输规划与管理]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.191.169.138