MotionDiffuser: Управляемое прогнозирование движения множества агентов с использованием диффузии
MotionDiffuser: Controllable Multi-Agent Motion Prediction using Diffusion
June 5, 2023
Авторы: Chiyu Max Jiang, Andre Cornman, Cheolho Park, Ben Sapp, Yin Zhou, Dragomir Anguelov
cs.AI
Аннотация
Мы представляем MotionDiffuser — диффузионное представление для совместного распределения будущих траекторий множества агентов. Такое представление имеет несколько ключевых преимуществ: во-первых, наша модель обучается на высоко мультимодальном распределении, которое охватывает разнообразные будущие исходы. Во-вторых, простая архитектура предсказателя требует только одного целевого показателя обучения — L2-потери — и не зависит от якорных траекторий. В-третьих, наша модель способна обучать совместное распределение для движения множества агентов в перестановочно-инвариантной манере. Кроме того, мы используем сжатое представление траекторий с помощью PCA, что улучшает производительность модели и позволяет эффективно вычислять точную логарифмическую вероятность выборки. Впоследствии мы предлагаем общую структуру ограниченной выборки, которая позволяет управлять выборкой траекторий на основе дифференцируемых функций стоимости. Эта стратегия открывает множество приложений, таких как наложение правил и физических априорных условий или создание специализированных сценариев симуляции. MotionDiffuser может быть интегрирован с существующими базовыми архитектурами для достижения наилучших результатов в прогнозировании движения. Мы получаем результаты, соответствующие современному уровню, в задаче прогнозирования движения множества агентов на наборе данных Waymo Open Motion Dataset.
English
We present MotionDiffuser, a diffusion based representation for the joint
distribution of future trajectories over multiple agents. Such representation
has several key advantages: first, our model learns a highly multimodal
distribution that captures diverse future outcomes. Second, the simple
predictor design requires only a single L2 loss training objective, and does
not depend on trajectory anchors. Third, our model is capable of learning the
joint distribution for the motion of multiple agents in a permutation-invariant
manner. Furthermore, we utilize a compressed trajectory representation via PCA,
which improves model performance and allows for efficient computation of the
exact sample log probability. Subsequently, we propose a general constrained
sampling framework that enables controlled trajectory sampling based on
differentiable cost functions. This strategy enables a host of applications
such as enforcing rules and physical priors, or creating tailored simulation
scenarios. MotionDiffuser can be combined with existing backbone architectures
to achieve top motion forecasting results. We obtain state-of-the-art results
for multi-agent motion prediction on the Waymo Open Motion Dataset.