复杂城市驾驶场景中,第一个证明了用策略梯度学习,可以从大量真实世界演示数据中学习模仿驾驶策略;一个新的可微分仿真器,可基于过去的数据进行闭环仿真,并通过时间的反向传播计算策略梯度,实现快速学习;单纯在仿真器中训练可在真实世界中控制自动驾驶车辆,优于其他方法;
Autonomous Driving | DriverGym Democratising Reinforcement Learning for Autonomous Driving
DriverGym仿真环境介绍
Autonomous Driving | Model-based offline planning
由于成本、安全性等因素,很多情况下不能够直接与系统交互来学习控制策略,因此,只能从记录的log数据中学习控制策略(offline reinforcement learning)。本文介绍了一种从log数据中学到超越成圣log数据的原策略的新策略的方法,命名为 model-based ofline planning (MBOP)。
Autonomous Driving | A Review of Motion Planning for Highway Autonomous Driving
高速路具有路径高速(high speed)、路径曲率小(small curvature roads)、规则具体(specific driver rules)的几项特点。
使用VSCode调试带参数的Python脚本
linux系统上执行带参数的python程序直接添加-arg xxx即可。但在VSCode调试模式(Debug)下该执行方式不可行。那么是否有办法在VSCode上调试带参数的python脚本呢?
Autonomous Driving | MotionCNN: A Strong Baseline for Motion Prediction in Autonomous Driving (2022)
MotionCNN
Network Structure | A ConvNet for the 2020s (Facebook, 2022)
纯卷积的网络堪比transformer
Autonomous Driving | ChauffeurNet: Learning to Drive by Imitating the Best and Synthesizing the Worst (Waymo, 2018)
ChauffeurNet