Modelos Mundiales Web
Web World Models
December 29, 2025
Autores: Jichen Feng, Yifan Zhang, Chenggong Zhang, Yifu Lu, Shilong Liu, Mengdi Wang
cs.AI
Resumen
Los agentes lingüísticos requieren cada vez más mundos persistentes en los que puedan actuar, recordar y aprender. Los enfoques existentes se sitúan en dos extremos: los frameworks web convencionales proporcionan contextos fiables pero fijos respaldados por bases de datos, mientras que los modelos de mundo completamente generativos aspiran a entornos ilimitados a costa de la controlabilidad y la ingeniería práctica. En este trabajo, presentamos el Modelo de Mundo Web (WWM), un punto intermedio en el que el estado del mundo y la "física" se implementan en código web ordinario para garantizar la coherencia lógica, mientras que los modelos de lenguaje grande generan contexto, narrativas y decisiones de alto nivel sobre este estado latente estructurado. Construimos un conjunto de WWM sobre una pila web realista, que incluye un atlas de viaje infinito basado en geografía real, exploradores de galaxias ficticias, mundos enciclopédicos y narrativos a escala web, y entornos similares a simulaciones y videojuegos. A través de estos sistemas, identificamos principios de diseño prácticos para los WWM: separar las reglas definidas por código de la imaginación impulsada por modelos, representar el estado latente como interfaces web tipadas y utilizar la generación determinista para lograr una exploración ilimitada pero estructurada. Nuestros resultados sugieren que las pilas web en sí mismas pueden servir como un sustrato escalable para modelos de mundo, permitiendo entornos controlables pero de final abierto. Página del proyecto: https://github.com/Princeton-AI2-Lab/Web-World-Models.
English
Language agents increasingly require persistent worlds in which they can act, remember, and learn. Existing approaches sit at two extremes: conventional web frameworks provide reliable but fixed contexts backed by databases, while fully generative world models aim for unlimited environments at the expense of controllability and practical engineering. In this work, we introduce the Web World Model (WWM), a middle ground where world state and ``physics'' are implemented in ordinary web code to ensure logical consistency, while large language models generate context, narratives, and high-level decisions on top of this structured latent state. We build a suite of WWMs on a realistic web stack, including an infinite travel atlas grounded in real geography, fictional galaxy explorers, web-scale encyclopedic and narrative worlds, and simulation- and game-like environments. Across these systems, we identify practical design principles for WWMs: separating code-defined rules from model-driven imagination, representing latent state as typed web interfaces, and utilizing deterministic generation to achieve unlimited but structured exploration. Our results suggest that web stacks themselves can serve as a scalable substrate for world models, enabling controllable yet open-ended environments. Project Page: https://github.com/Princeton-AI2-Lab/Web-World-Models.