M2I: From Factored Marginal Trajectory Prediction to Interactive Prediction
本文尝试将一个 joint prediction problem 解耦为多个 marginal prediction problems,将轨迹交互的车辆作为pair进行考虑,然后使用marginal轨迹预测模型和条件预测模型获得轨迹的联合的似然度。
1 Introduction
- 预测不通车辆的goals会面临goal随着车辆数指数增长的情况(一辆车通常几百个候选点);
- 后处理去除有碰撞的轨迹,临时方案;
使用 marginal 预测 influencer 轨迹,使用 conditional predictor 预测 reactor
使用启发式的方式预标注了车辆间的行为影响关系 pre-label the influencer-reactor relation based on a heuristic
在waymo open motion dataset 上取得了sota的成绩
2 Related work
- 为了处理多模态轨迹预测问题,可以使用GMMs,每个混合的分量代表了一种行为模态;
- 另一种方法不同于参数化预测的分布,一些生成式模型(GANs,VAEs)产生轨迹采样近似分布空间,但这些模型采样效率低,需要很多样本才能覆盖不同的驾驶场景;
- 一些模型预测 high-level intention,例如:
- goal targets,
- 选道,
- 机动动作(maneuver actions)
2.1 Interactive Trajectory Prediction
手工设计的交互模型(hand-crafted interaction model),不能建模高度复杂的非线性交互过程
- social forces
- energy functions
FeiFei Li等人设计social pooling mechanisms 获取拥挤场景下周围邻近行人的影响
一些文章用GNN预测 agent-to-agent 的交互
一些文章利用 attention 和 transformer mechanisms 学习多智能体交互行为
2.2 Conditional Trajectory Prediction
3 Approach
,两个分量分别是地图信息和agents的状态; 目标是要去预测未来T个时刻的agents轨迹
的联合分布为: 其中, 是Influencer, 是Reactor 如果两个agent没有交互,那么概率为:
其中,N表示交互的agent数量, 表示Influencer agents的集合 M2I采用了多个encoder-decoder结构,如图
- 实现的算法效果
M2I整体思路比较新颖直接,先预测交互的车辆,然后预测Influencer的轨迹,再根据Influencer轨迹预测Reactor轨迹;但是在预测Reactor agent的轨迹时,只考虑单条Influencer的预测轨迹,缺失了多模态的信息;整体性能比scene transformer差,只有mAP指标相当,模型还是比较粗糙的;