ChatPaper.aiChatPaper

WildSmoke: Готовые к использованию динамические 3D-ассеты дыма из одного видео в естественных условиях

WildSmoke: Ready-to-Use Dynamic 3D Smoke Assets from a Single Video in the Wild

September 14, 2025
Авторы: Yuqiu Liu, Jialin Song, Manolis Savva, Wuyang Chen
cs.AI

Аннотация

Мы предлагаем конвейер для извлечения и реконструкции динамических 3D-моделей дыма из одного видеоролика, снятого в естественных условиях, с последующей интеграцией интерактивного моделирования для проектирования и редактирования дыма. Последние достижения в области 3D-визуализации значительно улучшили реконструкцию и рендеринг динамики жидкостей, обеспечивая реалистичный и временно согласованный синтез изображений. Однако текущие методы реконструкции жидкостей в значительной степени зависят от тщательно контролируемых лабораторных условий, тогда как видеоролики, снятые в реальных условиях, остаются малоизученными. Мы выделяем три ключевые проблемы реконструкции дыма в видеороликах из реального мира и разрабатываем целевые методы, включая извлечение дыма с удалением фона, инициализацию частиц дыма и позиций камеры, а также вывод многовидовых видеороликов. Наш метод не только превосходит предыдущие подходы к реконструкции и генерации, обеспечивая высококачественную реконструкцию дыма (+2.22 среднего PSNR на видеороликах из реального мира), но также позволяет выполнять разнообразное и реалистичное редактирование динамики жидкостей путем моделирования наших 3D-моделей дыма. Мы предоставляем наши модели, данные и 4D-модели дыма по адресу [https://autumnyq.github.io/WildSmoke](https://autumnyq.github.io/WildSmoke).
English
We propose a pipeline to extract and reconstruct dynamic 3D smoke assets from a single in-the-wild video, and further integrate interactive simulation for smoke design and editing. Recent developments in 3D vision have significantly improved reconstructing and rendering fluid dynamics, supporting realistic and temporally consistent view synthesis. However, current fluid reconstructions rely heavily on carefully controlled clean lab environments, whereas real-world videos captured in the wild are largely underexplored. We pinpoint three key challenges of reconstructing smoke in real-world videos and design targeted techniques, including smoke extraction with background removal, initialization of smoke particles and camera poses, and inferring multi-view videos. Our method not only outperforms previous reconstruction and generation methods with high-quality smoke reconstructions (+2.22 average PSNR on wild videos), but also enables diverse and realistic editing of fluid dynamics by simulating our smoke assets. We provide our models, data, and 4D smoke assets at [https://autumnyq.github.io/WildSmoke](https://autumnyq.github.io/WildSmoke).
PDF32September 19, 2025