ChatPaper.aiChatPaper

WorldGen: Del Texto a Mundos 3D Transitables e Interactivos

WorldGen: From Text to Traversable and Interactive 3D Worlds

November 20, 2025
Autores: Dilin Wang, Hyunyoung Jung, Tom Monnier, Kihyuk Sohn, Chuhang Zou, Xiaoyu Xiang, Yu-Ying Yeh, Di Liu, Zixuan Huang, Thu Nguyen-Phuoc, Yuchen Fan, Sergiu Oprea, Ziyan Wang, Roman Shapovalov, Nikolaos Sarafianos, Thibault Groueix, Antoine Toisoul, Prithviraj Dhar, Xiao Chu, Minghao Chen, Geon Yeong Park, Mahima Gupta, Yassir Azziz, Rakesh Ranjan, Andrea Vedaldi
cs.AI

Resumen

Presentamos WorldGen, un sistema que permite la creación automática de mundos 3D interactivos a gran escala directamente a partir de instrucciones de texto. Nuestro enfoque transforma descripciones en lenguaje natural en entornos transitables y completamente texturizados que pueden explorarse o editarse inmediatamente dentro de motores de juego estándar. Al combinar el razonamiento para la disposición de escenas impulsado por LLM, la generación procedural, la generación 3D basada en difusión y la descomposición de escenas con conciencia de objetos, WorldGen salva la brecha entre la intención creativa y los espacios virtuales funcionales, permitiendo a los creadores diseñar mundos coherentes y navegables sin necesidad de modelado manual o experiencia especializada en 3D. El sistema es completamente modular y admite un control detallado sobre el diseño, la escala y el estilo, produciendo mundos geométricamente consistentes, visualmente ricos y eficientes para renderizar en tiempo real. Este trabajo representa un paso hacia la construcción de mundos generativos accesibles a gran escala, avanzando la frontera de la IA generativa 3D para aplicaciones en juegos, simulaciones y entornos sociales inmersivos.
English
We introduce WorldGen, a system that enables the automatic creation of large-scale, interactive 3D worlds directly from text prompts. Our approach transforms natural language descriptions into traversable, fully textured environments that can be immediately explored or edited within standard game engines. By combining LLM-driven scene layout reasoning, procedural generation, diffusion-based 3D generation, and object-aware scene decomposition, WorldGen bridges the gap between creative intent and functional virtual spaces, allowing creators to design coherent, navigable worlds without manual modeling or specialized 3D expertise. The system is fully modular and supports fine-grained control over layout, scale, and style, producing worlds that are geometrically consistent, visually rich, and efficient to render in real time. This work represents a step towards accessible, generative world-building at scale, advancing the frontier of 3D generative AI for applications in gaming, simulation, and immersive social environments.
PDF183December 1, 2025