基于强化学习虚拟链路驾驶行为仿真环境研究  被引量:1

Research on Simulation Environment of Driving Behavior Based on Reinforcement Learning Virtual Link

在线阅读下载全文

作  者:聂梓润 徐野 哈乐 

机构地区:[1]沈阳理工大学自动化与电气工程学院,辽宁沈阳110159 [2]北部战区总医院医学工程科,辽宁沈阳110015

出  处:《工业控制计算机》2022年第11期128-130,共3页Industrial Control Computer

基  金:国家自然科学基金项目(61373159);辽宁省高等学校优秀人才支持计划(LJQ2015095);沈阳市科技创新平台建设计划项目(17-118-1-00);沈阳理工大学重点学科、重点实验室开放基金项目(4771004kfs18)。

摘  要:强化学习是当前人工智能和机器学习研究领域的热门研究方向,通过反复试错和与环境的交互获得策略的改进。UBI车险则是一种基于分析驾驶行为的保险,由车联网和车载OBD设备将驾驶者的驾驶习惯、驾驶数据和车辆周围环境等数据结合起来建立模型进行定价,以规范驾驶者的行为。受以上两种技术的启发,提出一种可应用于智能体训练的环境,以解决规范以及纠正驾驶行为的问题。最后采用Deep Q Network验证了环境的的可行性。实验结果表明,智能体可在该环境中训练,并能学习到面对当前状态所要执行相应的动作。The improvement of policies is obtained through trial and error and interaction with the environment.UBI auto insurance is an insurance based on analyzing driving behavior.The Internet of Vehicles and in-vehicle OBD devices combine the driver’s driving habits,driving data and the surrounding environment of the vehicle to establish a model for pricing to regulate the driver’s behavior.Inspired by the above two technology,this paper proposes an environment that can be applied to agent training to address the problem of regulating and correcting driving behavior.Finally,the Deep Q Network is used to verify the feasibility of the environment.The experimental results show that the agent can be trained in this environment.

关 键 词:强化学习环境 驾驶行为 虚拟道路 智能体训练 

分 类 号:U463.6[机械工程—车辆工程] U495[交通运输工程—载运工具运用工程] TP18[交通运输工程—道路与铁道工程] TP391.9[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象