Web-Weltmodelle
Web World Models
December 29, 2025
papers.authors: Jichen Feng, Yifan Zhang, Chenggong Zhang, Yifu Lu, Shilong Liu, Mengdi Wang
cs.AI
papers.abstract
Sprachagenten benötigen zunehmend persistente Welten, in denen sie handeln, sich erinnern und lernen können. Bestehende Ansätze bewegen sich zwischen zwei Extremen: Konventionelle Web-Frameworks bieten zuverlässige, aber feste Kontexte, die durch Datenbanken abgesichert sind, während vollständig generative Weltmodelle auf unbegrenzte Umgebungen abzielen, jedoch auf Kosten von Kontrollierbarkeit und praktischer Umsetzbarkeit. In dieser Arbeit stellen wir das Web World Model (WWM) vor, einen Mittelweg, bei dem der Weltzustand und die „Physik“ in gewöhnlichem Web-Code implementiert sind, um logische Konsistenz zu gewährleisten, während große Sprachmodelle Kontext, Narrative und hochrangige Entscheidungen auf diesem strukturierten latenten Zustand generieren. Wir entwickeln eine Reihe von WWMs auf einem realistischen Web-Stack, darunter einen unendlichen Reiseatlas, der auf realer Geografie basiert, fiktionale Galaxien-Explorer, webskalige enzyklopädische und narrative Welten sowie simulations- und spielähnliche Umgebungen. Anhand dieser Systeme identifizieren wir praktische Designprinzipien für WWMs: die Trennung von code-definierten Regeln und modellgetriebener Imagination, die Darstellung latenter Zustände als typisierte Web-Schnittstellen und die Nutzung deterministischer Generierung, um unbegrenzte aber strukturierte Exploration zu erreichen. Unsere Ergebnisse deuten darauf hin, dass Web-Stacks selbst als skalierbares Substrat für Weltmodelle dienen können, um kontrollierbare und dennoch offene Umgebungen zu ermöglichen. Projektseite: https://github.com/Princeton-AI2-Lab/Web-World-Models.
English
Language agents increasingly require persistent worlds in which they can act, remember, and learn. Existing approaches sit at two extremes: conventional web frameworks provide reliable but fixed contexts backed by databases, while fully generative world models aim for unlimited environments at the expense of controllability and practical engineering. In this work, we introduce the Web World Model (WWM), a middle ground where world state and ``physics'' are implemented in ordinary web code to ensure logical consistency, while large language models generate context, narratives, and high-level decisions on top of this structured latent state. We build a suite of WWMs on a realistic web stack, including an infinite travel atlas grounded in real geography, fictional galaxy explorers, web-scale encyclopedic and narrative worlds, and simulation- and game-like environments. Across these systems, we identify practical design principles for WWMs: separating code-defined rules from model-driven imagination, representing latent state as typed web interfaces, and utilizing deterministic generation to achieve unlimited but structured exploration. Our results suggest that web stacks themselves can serve as a scalable substrate for world models, enabling controllable yet open-ended environments. Project Page: https://github.com/Princeton-AI2-Lab/Web-World-Models.