检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:马祥元 MA Xiangyuan(Changjiang Spatial Information Technology Engineering Co.Ltd(Wuhan),Wuhan 430010,China)
机构地区:[1]长江空间信息技术工程有限公司(武汉),湖北武汉430010
出 处:《武汉大学学报(信息科学版)》2023年第12期2108-2108,共1页Geomatics and Information Science of Wuhan University
摘 要:交通领域的传统线性规划方法仅在静态网络中求解有限规模的资源调度问题。笔者面向城市巡游出租车长周期运营过程优化目标,使用融合了监督学习神经网络机制和奖励的深度强化学习技术替代线性规划,将动态交通网络中表征乘客和驾驶员出行行为下的时空变化特征、状态属性特征和交互关系特征等领域知识转换映射为包含状态、行为、转移概率和奖励函数等元组的马尔可夫过程.
关 键 词:深度强化学习 马尔可夫过程 属性特征 动态交通网络 线性规划方法 转移概率 多智能体 出行行为
分 类 号:P208[天文地球—地图制图学与地理信息工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3