WonderZoom: Multi-schaal 3D-wereldgeneratie
WonderZoom: Multi-Scale 3D World Generation
December 9, 2025
Auteurs: Jin Cao, Hong-Xing Yu, Jiajun Wu
cs.AI
Samenvatting
Wij presenteren WonderZoom, een nieuwe benadering voor het genereren van 3D-scènes met inhoud over meerdere ruimtelijke schalen vanuit één enkele afbeelding. Bestaande 3D-wereldgeneratiemodellen blijven beperkt tot synthese op één schaal en kunnen geen samenhangende scène-inhoud op verschillende granulariteiten produceren. De fundamentele uitdaging is het ontbreken van een schaalbewuste 3D-representatie die in staat is om inhoud met sterk uiteenlopende ruimtelijke afmetingen te genereren en renderen. WonderZoom lost dit op door twee belangrijke innovaties: (1) schaalaanpasbare Gaussische surfels voor het genereren en realtime renderen van multi-schaal 3D-scènes, en (2) een progressieve detailsynthesizer die iteratief fijnere 3D-inhoud genereert. Onze aanpak stelt gebruikers in staat om "in te zoomen" op een 3D-gebied en autogressief voorheen niet-bestaande fijne details te synthetiseren, van landschappen tot microscopische kenmerken. Experimenten tonen aan dat WonderZoom zowel in kwaliteit als uitlijning significant beter presteert dan state-of-the-art video- en 3D-modellen, waardoor creatie van multi-schaal 3D-werelden vanuit één afbeelding mogelijk wordt. Wij tonen videoresultaten en een interactieve viewer van gegenereerde multi-schaal 3D-werelden op https://wonderzoom.github.io/.
English
We present WonderZoom, a novel approach to generating 3D scenes with contents across multiple spatial scales from a single image. Existing 3D world generation models remain limited to single-scale synthesis and cannot produce coherent scene contents at varying granularities. The fundamental challenge is the lack of a scale-aware 3D representation capable of generating and rendering content with largely different spatial sizes. WonderZoom addresses this through two key innovations: (1) scale-adaptive Gaussian surfels for generating and real-time rendering of multi-scale 3D scenes, and (2) a progressive detail synthesizer that iteratively generates finer-scale 3D contents. Our approach enables users to "zoom into" a 3D region and auto-regressively synthesize previously non-existent fine details from landscapes to microscopic features. Experiments demonstrate that WonderZoom significantly outperforms state-of-the-art video and 3D models in both quality and alignment, enabling multi-scale 3D world creation from a single image. We show video results and an interactive viewer of generated multi-scale 3D worlds in https://wonderzoom.github.io/