- 当前自动驾驶的主要问题之一是缺少标注的数据,例如3D bounding box和语义分割框,标注费用昂贵;
- 大部分数据都是直行,缺少关键场景数据;
- 本文利用主动学习来对原始数据进行注释,提出了planning-oriented端到端模型;
- 仅适用30%的nuScenes数据实现了SOTA的端到端模型效果;
1 Introduction
- 当前最好的E2E模型例如UniAD和VAD都需要大量的标注数据以进行监督学习,标签也成了这些模型的发展瓶颈;
- 并且驾驶场景数据有长尾问题,绝大部分的数据都是无用的,这一因素也限制了data-driven模型的应用;
- 本文受UniAD启发,引入主动学习方法到planning-oriented自动驾驶算法框架中,直接优化规划结果;
- 将主动学习引入自动驾驶任务的GAPs:
- 自动驾驶数据多模态特性(视频数据、驾驶轨迹、车速、以及其他原始数据),传统的主动学习只考虑单一模态的图像数据作为输入;
- 自动驾驶任务比分类问题更复杂;
实施过程:
在初始采样选择阶段,ActiveAD引入了ego多样性来替代传统AD范式中常用的随机选择;ego多样性包括三个方面, weather, lighting, and vehicle speed;
在主动采样迭代阶段,提出了三种标签度量方式:
- Displacement Error:使用原始自车轨迹作为度量依据;
- Soft Collision:用预测的自车轨迹和他车轨迹计算潜在碰撞风险,是一个连续版本的碰撞率;
- Agent Uncertainty:考虑复杂的路况,计算其他车辆的不确定性;
2 Related Work
2.1 End-to-End Autonomous Driving
- 发展路线:
- 直接深度学习建立图像到控制的映射;
- 强化学习控制车辆;
- 使用Transformer架构训练decoder-only模型;
- 使用多模态的传感器数据;
- ST-P3整合检测、预测、规划到BEV空间中;
- UniAD使用Transformer连接各个任务;
- VAD将任务模块进行删减,提升了性能;
2.2 Active Learning
- we fill in this gap by devising novel uncertainty and diversity metrics for active learning of end-to-end AD
3 Formulation of Active Learning for AD
定义
表示t时刻的原始图像, 是相应的clips序列 的长度; 记录的自车轨迹
、状态为 (包括速度 和驾驶指令 ) 天气条件
(Sunny or Rainy),光照条件 (Day or Night) 上述易得的标签记为
,场景信息记为 其中 , 表示场景个数 而需要精细标注的标签记为
,其中, 表示属性(visibility, activity, and pose), 表示3D框, 表示语义分割的车道; 一开始我们只有无标签的数据集记为
在给定标注预算 ( <N)的情况下,需要选择序号集合 ,以从 中获得子集 以及相应的标签 , 模型在有标签的集合
上训练 目标是选择数据集最小化期望误差(L2误差和碰撞率)
4 The Proposed ActiveAD
4.1 Initial Sample Selection for Labeling
- 传统CV方向进行标签初始化时缺少可用的先验信息,大多使用Random initialization;而在自动驾驶场景中,有很多标签是容易获得的,可以帮助进行初始化;本文就设计了ego-diversity度量来初始化选择过程
- ego多样性(Ego-Diversity)包括三个部分
- weather-lighting
- driving commands
- average speed
- 初始化步骤:
- 首先,将数据集分为4个互斥的子集:Day-Sunny (DS), Day-Rainy (DR), Night-Sunny (NS), Night-Rainy (NR)
- 然后,根据车辆行为进一步将数据集分为4类Turn Left (L), Turn Right
(R), Overtake (O), Go Straight (S);设计了一个转向的阈值
,如clip中的左转和右转时间步数量大于等于阈值 ,则我们认为这个clip是超车(overtake)场景 - 仅当左转的数量大于阈值
时,认为该场景为左转场景;同理可以定义右转场景,其余的为直行场景; - 最后,计算每个场景中的平均速度,并在相关子集中按升序排序
- 给定初始化标注budget
,需要将其划分给每个子集;定义原始子集 的样本数量为 ,被选择给标签的样本数量为 ,引入了一个参数 用以控制每个子集的比例 。可得,first-level 天气-光照子集的比例计算方式如下:
其中,
- 每个子集
标注的数量为 ,当 ,表示绝对的均匀分布,每个类别数量都相等;如果 ,则表示会有一个偏置,表明偏向样本总数较少的类别
其中,
4.2 Criterion Design for Incremental Selection
Criterion I: Displacement Error (DE)
设轨迹的模态数量为
Overall Loss
4.3 Overall Active Learning Paradigm
5 Experiments
We conduct experiments on the widely used nuScenes dataset [4] in line with the peer works. All experiments are implemented using PyTorch and run on RTX 3090 and A100 GPUs. Source code will be made publicly available.
总结
ActiveAD从数据标注的角度入手,考虑如何减少对标注的需求(主要是感知任务上的标注),在端到端模型中引入了主动学习,迭代地使用有标签困难样本训练模型,提升数据的使用效率;实验结果显示使用了该方法的VAD模型的规划能力有较明显的提升,方法值得借鉴。