MotionDiffuser: Predicción de Movimiento Multiagente Controlable mediante Difusión
MotionDiffuser: Controllable Multi-Agent Motion Prediction using Diffusion
June 5, 2023
Autores: Chiyu Max Jiang, Andre Cornman, Cheolho Park, Ben Sapp, Yin Zhou, Dragomir Anguelov
cs.AI
Resumen
Presentamos MotionDiffuser, una representación basada en difusión para la distribución conjunta de trayectorias futuras de múltiples agentes. Dicha representación ofrece varias ventajas clave: primero, nuestro modelo aprende una distribución altamente multimodal que captura diversos resultados futuros. Segundo, el diseño simple del predictor requiere solo un objetivo de entrenamiento con pérdida L2 y no depende de anclajes de trayectoria. Tercero, nuestro modelo es capaz de aprender la distribución conjunta para el movimiento de múltiples agentes de manera permutación-invariante. Además, utilizamos una representación comprimida de trayectorias mediante PCA, lo que mejora el rendimiento del modelo y permite el cálculo eficiente de la probabilidad logarítmica exacta de las muestras. Posteriormente, proponemos un marco general de muestreo restringido que permite el muestreo controlado de trayectorias basado en funciones de coste diferenciables. Esta estrategia habilita una variedad de aplicaciones, como la imposición de reglas y conocimientos físicos previos, o la creación de escenarios de simulación personalizados. MotionDiffuser puede combinarse con arquitecturas base existentes para lograr resultados de vanguardia en la predicción de movimiento. Obtenemos resultados de última generación en la predicción de movimiento multiagente en el conjunto de datos Waymo Open Motion.
English
We present MotionDiffuser, a diffusion based representation for the joint
distribution of future trajectories over multiple agents. Such representation
has several key advantages: first, our model learns a highly multimodal
distribution that captures diverse future outcomes. Second, the simple
predictor design requires only a single L2 loss training objective, and does
not depend on trajectory anchors. Third, our model is capable of learning the
joint distribution for the motion of multiple agents in a permutation-invariant
manner. Furthermore, we utilize a compressed trajectory representation via PCA,
which improves model performance and allows for efficient computation of the
exact sample log probability. Subsequently, we propose a general constrained
sampling framework that enables controlled trajectory sampling based on
differentiable cost functions. This strategy enables a host of applications
such as enforcing rules and physical priors, or creating tailored simulation
scenarios. MotionDiffuser can be combined with existing backbone architectures
to achieve top motion forecasting results. We obtain state-of-the-art results
for multi-agent motion prediction on the Waymo Open Motion Dataset.