多智能体深度强化学习机制的巡游出租车调度策略优化  

Dispatching policy optimizing of cruise taxi in a multiagent-based deep reinforcement learning framework

在线阅读下载全文

作  者:马祥元 MA Xiangyuan(Changjiang Spatial Information Technology Engineering Co.,Ltd.(Wuhan),Wuhan 430019,China)

机构地区:[1]长江空间信息技术工程有限公司(武汉),湖北武汉430019

出  处:《测绘学报》2024年第4期778-778,共1页Acta Geodaetica et Cartographica Sinica

基  金:国家自然科学基金(42071448)。

摘  要:交通领域传统线性规划方法仅在静态网络中求解有限规模的资源调度问题。论文将动态交通网络中表征乘客和驾驶员出行行为下的时空变化特征、状态属性特征和交互关系特征等领域知识转换映射为包含状态、行为、转移概率和奖励函数等元组的马尔可夫过程,基于序贯决策思想在强化学习框架内的多智能体合作型随机博弈场景下,求解多对象司乘匹配和车辆行为选择策略优化任务的组合动态优化问题。论文主要研究内容如下。

关 键 词:马尔可夫过程 属性特征 深度强化学习 多智能体 动态交通网络 线性规划方法 序贯决策 转移概率 

分 类 号:P228[天文地球—大地测量学与测量工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象