基于模仿学习的自动驾驶智能体构建  被引量:3

在线阅读下载全文

作  者:杨瑞阳 金蓓弘[1,2] 

机构地区:[1]中国科学院软件研究所,北京100190 [2]中国科学院大学,北京100049

出  处:《人工智能》2022年第4期30-39,共10页Artificial Intelligence View

基  金:国家重点研发计划(2020YFB2103900)。

摘  要:模仿学习是智能体从专家轨迹数据中学习获得尽可能靠近专家策略决策的智能学习方法。近年来,模仿学习已从早期的行为克隆发展到了逆强化学习、生成对抗模仿学习,以及多智能体模仿学习。而目前自动驾驶技术中传感器获取外界信息的能力与深度学习实现的感知环境能力都日趋完善,在决策部分,依靠基于规则的模型可应对大部分常见驾驶场景,但针对规则模型中不适用的极端场景,如何智能化实现安全决策,仍是当前研究的热点问题。本文综述了模仿学习在自动驾驶领域的代表性工作,详细讨论了它们的优势与不足并指出了它们未来的发展趋势。

关 键 词:模仿学习 生成对抗模仿学习 多智能体模仿学习 自动驾驶 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象