ChatPaper.aiChatPaper

WonderZoom: Geração de Mundos 3D em Múltiplas Escalas

WonderZoom: Multi-Scale 3D World Generation

December 9, 2025
Autores: Jin Cao, Hong-Xing Yu, Jiajun Wu
cs.AI

Resumo

Apresentamos a WonderZoom, uma nova abordagem para gerar cenas 3D com conteúdos em múltiplas escalas espaciais a partir de uma única imagem. Os modelos existentes de geração de mundos 3D permanecem limitados à síntese em escala única e não conseguem produzir conteúdos de cena coerentes em diferentes granularidades. O desafio fundamental é a falta de uma representação 3D consciente da escala, capaz de gerar e renderizar conteúdos com tamanhos espaciais largamente diferentes. A WonderZoom aborda este problema através de duas inovações principais: (1) *surfels* Gaussianos adaptativos à escala para geração e renderização em tempo real de cenas 3D multi-escala, e (2) um sintetizador de detalhes progressivo que gera iterativamente conteúdos 3D em escalas mais finas. Nossa abordagem permite que os usuários "ampliem" uma região 3D e sintetizem de forma autoregressiva detalhes finos previamente inexistentes, desde paisagens até características microscópicas. Experimentos demonstram que a WonderZoom supera significativamente os modelos state-of-the-art de vídeo e 3D tanto em qualidade quanto em alinhamento, permitindo a criação de mundos 3D multi-escala a partir de uma única imagem. Mostramos resultados em vídeo e um visualizador interativo dos mundos 3D multi-escala gerados em https://wonderzoom.github.io/.
English
We present WonderZoom, a novel approach to generating 3D scenes with contents across multiple spatial scales from a single image. Existing 3D world generation models remain limited to single-scale synthesis and cannot produce coherent scene contents at varying granularities. The fundamental challenge is the lack of a scale-aware 3D representation capable of generating and rendering content with largely different spatial sizes. WonderZoom addresses this through two key innovations: (1) scale-adaptive Gaussian surfels for generating and real-time rendering of multi-scale 3D scenes, and (2) a progressive detail synthesizer that iteratively generates finer-scale 3D contents. Our approach enables users to "zoom into" a 3D region and auto-regressively synthesize previously non-existent fine details from landscapes to microscopic features. Experiments demonstrate that WonderZoom significantly outperforms state-of-the-art video and 3D models in both quality and alignment, enabling multi-scale 3D world creation from a single image. We show video results and an interactive viewer of generated multi-scale 3D worlds in https://wonderzoom.github.io/
PDF122March 20, 2026