MotionDiffuser : Prédiction de mouvement multi-agent contrôlable par diffusion
MotionDiffuser: Controllable Multi-Agent Motion Prediction using Diffusion
June 5, 2023
Auteurs: Chiyu Max Jiang, Andre Cornman, Cheolho Park, Ben Sapp, Yin Zhou, Dragomir Anguelov
cs.AI
Résumé
Nous présentons MotionDiffuser, une représentation basée sur la diffusion pour la distribution conjointe des trajectoires futures de multiples agents. Une telle représentation présente plusieurs avantages clés : premièrement, notre modèle apprend une distribution hautement multimodale qui capture une diversité de résultats futurs. Deuxièmement, la conception simple du prédicteur ne nécessite qu'un seul objectif d'entraînement par perte L2 et ne dépend pas d'ancres de trajectoire. Troisièmement, notre modèle est capable d'apprendre la distribution conjointe du mouvement de plusieurs agents de manière invariante par permutation. De plus, nous utilisons une représentation compressée des trajectoires via l'ACP, ce qui améliore les performances du modèle et permet un calcul efficace de la probabilité logarithmique exacte des échantillons. Par la suite, nous proposons un cadre général d'échantillonnage contraint qui permet un échantillonnage contrôlé des trajectoires basé sur des fonctions de coût différentiables. Cette stratégie permet une multitude d'applications telles que l'application de règles et de préférences physiques, ou la création de scénarios de simulation sur mesure. MotionDiffuser peut être combiné avec des architectures de base existantes pour obtenir des résultats de pointe en prévision de mouvement. Nous obtenons des résultats de pointe pour la prédiction de mouvement multi-agent sur le jeu de données Waymo Open Motion.
English
We present MotionDiffuser, a diffusion based representation for the joint
distribution of future trajectories over multiple agents. Such representation
has several key advantages: first, our model learns a highly multimodal
distribution that captures diverse future outcomes. Second, the simple
predictor design requires only a single L2 loss training objective, and does
not depend on trajectory anchors. Third, our model is capable of learning the
joint distribution for the motion of multiple agents in a permutation-invariant
manner. Furthermore, we utilize a compressed trajectory representation via PCA,
which improves model performance and allows for efficient computation of the
exact sample log probability. Subsequently, we propose a general constrained
sampling framework that enables controlled trajectory sampling based on
differentiable cost functions. This strategy enables a host of applications
such as enforcing rules and physical priors, or creating tailored simulation
scenarios. MotionDiffuser can be combined with existing backbone architectures
to achieve top motion forecasting results. We obtain state-of-the-art results
for multi-agent motion prediction on the Waymo Open Motion Dataset.