MotionDiffuser: Kontrollierbare Multi-Agenten-Bewegungsvorhersage mit Diffusion
MotionDiffuser: Controllable Multi-Agent Motion Prediction using Diffusion
June 5, 2023
Autoren: Chiyu Max Jiang, Andre Cornman, Cheolho Park, Ben Sapp, Yin Zhou, Dragomir Anguelov
cs.AI
Zusammenfassung
Wir präsentieren MotionDiffuser, eine auf Diffusion basierende Repräsentation für die gemeinsame Verteilung zukünftiger Trajektorien über mehrere Agenten hinweg. Eine solche Repräsentation bietet mehrere entscheidende Vorteile: Erstens lernt unser Modell eine hochgradig multimodale Verteilung, die diverse zukünftige Szenarien erfasst. Zweitens erfordert das einfache Prädiktordesign lediglich ein einzelnes L2-Verlust-Trainingsziel und ist unabhängig von Trajektorienankern. Drittens ist unser Modell in der Lage, die gemeinsame Verteilung für die Bewegung mehrerer Agenten auf eine permutationsinvariante Weise zu lernen. Darüber hinaus nutzen wir eine komprimierte Trajektoriendarstellung mittels PCA, die die Modellleistung verbessert und eine effiziente Berechnung der exakten Log-Wahrscheinlichkeit von Stichproben ermöglicht. Anschließend schlagen wir einen allgemeinen Rahmen für eingeschränktes Sampling vor, der kontrolliertes Trajektorien-Sampling basierend auf differenzierbaren Kostenfunktionen ermöglicht. Diese Strategie eröffnet eine Vielzahl von Anwendungen, wie die Durchsetzung von Regeln und physikalischen Vorannahmen oder die Erstellung maßgeschneiderter Simulationsszenarien. MotionDiffuser kann mit bestehenden Backbone-Architekturen kombiniert werden, um Spitzenergebnisse in der Bewegungsvorhersage zu erzielen. Wir erzielen state-of-the-art Ergebnisse für die Multi-Agenten-Bewegungsvorhersage auf dem Waymo Open Motion Dataset.
English
We present MotionDiffuser, a diffusion based representation for the joint
distribution of future trajectories over multiple agents. Such representation
has several key advantages: first, our model learns a highly multimodal
distribution that captures diverse future outcomes. Second, the simple
predictor design requires only a single L2 loss training objective, and does
not depend on trajectory anchors. Third, our model is capable of learning the
joint distribution for the motion of multiple agents in a permutation-invariant
manner. Furthermore, we utilize a compressed trajectory representation via PCA,
which improves model performance and allows for efficient computation of the
exact sample log probability. Subsequently, we propose a general constrained
sampling framework that enables controlled trajectory sampling based on
differentiable cost functions. This strategy enables a host of applications
such as enforcing rules and physical priors, or creating tailored simulation
scenarios. MotionDiffuser can be combined with existing backbone architectures
to achieve top motion forecasting results. We obtain state-of-the-art results
for multi-agent motion prediction on the Waymo Open Motion Dataset.