检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]吉林大学交通学院,吉林长春130025 [2]吉林大学机械科学与工程学院,吉林长春130025
出 处:《交通运输工程学报》2011年第5期109-114,共6页Journal of Traffic and Transportation Engineering
基 金:国家863计划项目(2009AA11Z218;2009AA11Z208);吉林省科技发展计划项目(20100176);吉林大学基本科研业务费科学前沿与交叉学科创新项目
摘 要:分析了高速公路主线可变限速控制的作用,研究了现有的限速方法,将高速公路主线可变限速控制过程看作是离散时间的马尔可夫决策过程,提出基于强化学习与有限阶段马尔可夫决策的可变限速控制模型,通过与交通环境的交互学习进行模型的动态调整。采用有限阶段向后递归迭代的算法对模型进行求解,运用Paramics仿真软件对长吉高速公路全程进行仿真。仿真结果表明:在平均限速值低于设计时速6.25%的情况下,平均流量不仅没有降低反而增加了3.20%。可见,该模型可以有效提高交通流量,改善高速公路主线的交通状况。The function of variable speed limit(VSL) on expressway mainline was analyzed,and the existing methods of speed limit were studied.The control process of VSL was taken as Markov decision-making process of discrete time.A model of VSL based on reinforcement learning and finite horizon Markov decision-making was proposed.The model was dynamically adjusted through interacting with traffic environment,and solved by using finite horizon backward recursive iterative algorithm.The traffic environment of Chang-Ji Expressway was simulated by using Paramics.Analysis result shows that average traffic volume doesn't reduce,but increases by 3.20% when average limit speed decreases by 6.25% compared with design speed.So the model is feasible to increase traffic volume and improve traffic condition on expressway mainline effectively.1 tab,4 figs,14 refs.
关 键 词:交通信息工程 可变限速控制 马尔可夫决策 强化学习 高速公路主线
分 类 号:U491[交通运输工程—交通运输规划与管理]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.149.7.172