WildSmoke: Sofort einsetzbare dynamische 3D-Rauch-Assets aus einem einzelnen Video in unkontrollierter Umgebung

papers.abstract

Wir schlagen eine Pipeline vor, um dynamische 3D-Rauch-Assets aus einem einzelnen Video in freier Umgebung zu extrahieren und zu rekonstruieren und diese weiterhin für interaktive Simulationen zur Rauchgestaltung und -bearbeitung zu integrieren. Jüngste Entwicklungen im Bereich der 3D-Vision haben die Rekonstruktion und das Rendering von Fluiddynamik erheblich verbessert, was realistische und zeitlich konsistente Ansichtssynthesen ermöglicht. Allerdings stützen sich aktuelle Rekonstruktionen von Fluiden stark auf sorgfältig kontrollierte Laborumgebungen, während Videos aus der realen Welt, die in freier Umgebung aufgenommen wurden, weitgehend unerforscht bleiben. Wir identifizieren drei zentrale Herausforderungen bei der Rekonstruktion von Rauch in realen Videos und entwickeln gezielte Techniken, darunter die Rauch-Extraktion mit Hintergrundentfernung, die Initialisierung von Rauchpartikeln und Kamerapositionen sowie die Inferenz von Multi-View-Videos. Unsere Methode übertrifft nicht nur bisherige Rekonstruktions- und Generierungsverfahren durch hochwertige Rauch-Rekonstruktionen (+2,22 durchschnittlicher PSNR bei Videos in freier Umgebung), sondern ermöglicht auch vielfältige und realistische Bearbeitungen der Fluiddynamik durch die Simulation unserer Rauch-Assets. Wir stellen unsere Modelle, Daten und 4D-Rauch-Assets unter [https://autumnyq.github.io/WildSmoke](https://autumnyq.github.io/WildSmoke) zur Verfügung.

English

We propose a pipeline to extract and reconstruct dynamic 3D smoke assets from a single in-the-wild video, and further integrate interactive simulation for smoke design and editing. Recent developments in 3D vision have significantly improved reconstructing and rendering fluid dynamics, supporting realistic and temporally consistent view synthesis. However, current fluid reconstructions rely heavily on carefully controlled clean lab environments, whereas real-world videos captured in the wild are largely underexplored. We pinpoint three key challenges of reconstructing smoke in real-world videos and design targeted techniques, including smoke extraction with background removal, initialization of smoke particles and camera poses, and inferring multi-view videos. Our method not only outperforms previous reconstruction and generation methods with high-quality smoke reconstructions (+2.22 average PSNR on wild videos), but also enables diverse and realistic editing of fluid dynamics by simulating our smoke assets. We provide our models, data, and 4D smoke assets at [https://autumnyq.github.io/WildSmoke](https://autumnyq.github.io/WildSmoke).

WildSmoke: Sofort einsetzbare dynamische 3D-Rauch-Assets aus einem einzelnen Video in unkontrollierter Umgebung

WildSmoke: Ready-to-Use Dynamic 3D Smoke Assets from a Single Video in the Wild

papers.abstract

Support