HD map具有的语义和几何信息使其成为自动驾驶系统的关键部件。但HD map的成本很高,难扩展,尤其是厘米级精度(centimeter-level accuracy)的情况下。因此能摆脱HD Map(地图加载失败、地图老旧等)的算法值得研究。本文提出了一种end2end的不依赖地图的自动驾驶算法——MP3。
Autonomous Driving | On the Choice of Data for Efficient Training and Validation of End-to-End Driving Models
本文关注数据集的设计,包括针对自动驾驶端到端模型训练集和验证集。
Autonomous Driving | 关于加减速变道的思考
业务思考
Autonomous Driving | Off-Policy Deep Reinforcement Learning without Exploration
类似DQN和DDPG的off-policy RL算法在被禁止探索,并在没有数据策略分布修正的的情况下,难以取得好的效果。本文通过限制off-policy agent的行为空间,使其行为类似与on-policy算法,最后提出了一个较为通用的,针对连续控制的deep reinforcement learning algorithm。
Autonomous Driving | Goal-driven Self-Attentive Recurrent Networks for Trajectory Prediction
提出了一种基于U-Net architecture和注意力的循环网络框架,增加了语义信息来预测轨迹终点。提出的算法在公开数据集SDD, inD, ETH/UCY上部分取得了SOTA的成绩,还简化了模型。
Autonomous Driving | SMARTS Scalable Multi-Agent Reinforcement Learning Training School for Autonomous Driving (Huawei)
顾名思义,SMARTS是针对多智能体算法的自动驾驶强化学习仿真平台。
Autonomous Driving | An Optimistic Perspective on Offline Reinforcement Learning (Google)
作者用online DQN在60款 Atari 2600游戏上获取数据样本,然后用这些样本(fixed dataset)训练offline强化学习算法,一些offline的算法性能可以超过online的算法。本文提出的Random Ensemble Mixture (REM)算法在离线回放数据上的表现超过了强的基准算法。因此作者认为在离线样本足够多,多样化充分的情况下,使用鲁棒的RL算法可以获得高质量的策略。
Autonomous Driving | UMBRELLA: Uncertainty-Aware Model-Based Offline Reinforcement Learning Leveraging Planning
在学习过程中考虑了随机不确定性的影响,提高了模型的可迁移性和可解释性