多智能体深度强化学习机制的巡游出租车调度策略优化  

Dispatching Policy Optimizing of Cruise Taxi in a Multiagent‑Based Deep Reinforcement Learning Framework

在线阅读下载全文

作  者:马祥元 MA Xiangyuan(Changjiang Spatial Information Technology Engineering Co.Ltd(Wuhan),Wuhan 430010,China)

机构地区:[1]长江空间信息技术工程有限公司(武汉),湖北武汉430010

出  处:《武汉大学学报(信息科学版)》2023年第12期2108-2108,共1页Geomatics and Information Science of Wuhan University

摘  要:交通领域的传统线性规划方法仅在静态网络中求解有限规模的资源调度问题。笔者面向城市巡游出租车长周期运营过程优化目标,使用融合了监督学习神经网络机制和奖励的深度强化学习技术替代线性规划,将动态交通网络中表征乘客和驾驶员出行行为下的时空变化特征、状态属性特征和交互关系特征等领域知识转换映射为包含状态、行为、转移概率和奖励函数等元组的马尔可夫过程.

关 键 词:深度强化学习 马尔可夫过程 属性特征 动态交通网络 线性规划方法 转移概率 多智能体 出行行为 

分 类 号:P208[天文地球—地图制图学与地理信息工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象