ChatPaper.aiChatPaper

Diffusiegebaseerde generatieve modellen voor 3D-bezettingsvoorspelling in autonoom rijden

Diffusion-Based Generative Models for 3D Occupancy Prediction in Autonomous Driving

May 29, 2025
Auteurs: Yunshen Wang, Yicheng Liu, Tianyuan Yuan, Yucheng Mao, Yingshi Liang, Xiuyu Yang, Honggang Zhang, Hang Zhao
cs.AI

Samenvatting

Het nauwkeurig voorspellen van 3D-occupatiegrids op basis van visuele invoer is cruciaal voor autonoom rijden, maar huidige discriminatieve methoden worstelen met ruis in de data, onvolledige waarnemingen en de complexe structuren die inherent zijn aan 3D-scènes. In dit werk herformuleren we 3D-occupatievoorspelling als een generatieve modelleertaak met behulp van diffusiemodellen, die de onderliggende datadistributie leren en 3D-scènepriors incorporeren. Deze aanpak verbetert de voorspellingsconsistentie, robuustheid tegen ruis en gaat beter om met de complexiteit van 3D-ruimtelijke structuren. Onze uitgebreide experimenten tonen aan dat diffusiegebaseerde generatieve modellen state-of-the-art discriminatieve benaderingen overtreffen, wat resulteert in realistischer en nauwkeurigere occupatievoorspellingen, vooral in verborgen of slecht zichtbare gebieden. Bovendien dragen de verbeterde voorspellingen significant bij aan downstream plannings taken, wat de praktische voordelen van onze methode voor real-world autonome rijdtoepassingen benadrukt.
English
Accurately predicting 3D occupancy grids from visual inputs is critical for autonomous driving, but current discriminative methods struggle with noisy data, incomplete observations, and the complex structures inherent in 3D scenes. In this work, we reframe 3D occupancy prediction as a generative modeling task using diffusion models, which learn the underlying data distribution and incorporate 3D scene priors. This approach enhances prediction consistency, noise robustness, and better handles the intricacies of 3D spatial structures. Our extensive experiments show that diffusion-based generative models outperform state-of-the-art discriminative approaches, delivering more realistic and accurate occupancy predictions, especially in occluded or low-visibility regions. Moreover, the improved predictions significantly benefit downstream planning tasks, highlighting the practical advantages of our method for real-world autonomous driving applications.
PDF22June 6, 2025