检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]沈阳理工大学自动化与电气工程学院,辽宁沈阳110159 [2]北部战区总医院医学工程科,辽宁沈阳110015
出 处:《工业控制计算机》2022年第11期128-130,共3页Industrial Control Computer
基 金:国家自然科学基金项目(61373159);辽宁省高等学校优秀人才支持计划(LJQ2015095);沈阳市科技创新平台建设计划项目(17-118-1-00);沈阳理工大学重点学科、重点实验室开放基金项目(4771004kfs18)。
摘 要:强化学习是当前人工智能和机器学习研究领域的热门研究方向,通过反复试错和与环境的交互获得策略的改进。UBI车险则是一种基于分析驾驶行为的保险,由车联网和车载OBD设备将驾驶者的驾驶习惯、驾驶数据和车辆周围环境等数据结合起来建立模型进行定价,以规范驾驶者的行为。受以上两种技术的启发,提出一种可应用于智能体训练的环境,以解决规范以及纠正驾驶行为的问题。最后采用Deep Q Network验证了环境的的可行性。实验结果表明,智能体可在该环境中训练,并能学习到面对当前状态所要执行相应的动作。The improvement of policies is obtained through trial and error and interaction with the environment.UBI auto insurance is an insurance based on analyzing driving behavior.The Internet of Vehicles and in-vehicle OBD devices combine the driver’s driving habits,driving data and the surrounding environment of the vehicle to establish a model for pricing to regulate the driver’s behavior.Inspired by the above two technology,this paper proposes an environment that can be applied to agent training to address the problem of regulating and correcting driving behavior.Finally,the Deep Q Network is used to verify the feasibility of the environment.The experimental results show that the agent can be trained in this environment.
分 类 号:U463.6[机械工程—车辆工程] U495[交通运输工程—载运工具运用工程] TP18[交通运输工程—道路与铁道工程] TP391.9[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7