ChatPaper.aiChatPaper

Modèles du Monde Web

Web World Models

December 29, 2025
papers.authors: Jichen Feng, Yifan Zhang, Chenggong Zhang, Yifu Lu, Shilong Liu, Mengdi Wang
cs.AI

papers.abstract

Les agents linguistiques nécessitent de plus en plus des mondes persistants dans lesquels ils peuvent agir, mémoriser et apprendre. Les approches existantes se situent à deux extrêmes : les frameworks web conventionnels fournissent des contextes fiables mais figés soutenus par des bases de données, tandis que les modèles de monde entièrement génératifs visent des environnements illimités au détriment de la contrôlabilité et de l'ingénierie pratique. Dans ce travail, nous présentons le Web World Model (WWM), un juste milieu où l'état du monde et la « physique » sont implémentés dans du code web ordinaire pour garantir la cohérence logique, tandis que les grands modèles linguistiques génèrent le contexte, les récits et les décisions de haut niveau sur la base de cet état latent structuré. Nous construisons une suite de WWM sur une stack web réaliste, comprenant un atlas de voyage infini ancré dans la géographie réelle, des explorateurs de galaxies fictives, des mondes encyclopédiques et narratifs à l'échelle du web, ainsi que des environnements de type simulation et jeu. À travers ces systèmes, nous identifions des principes de conception pratiques pour les WWM : séparer les règles définies par code de l'imagination pilotée par modèle, représenter l'état latent sous forme d'interfaces web typées, et utiliser la génération déterministe pour réaliser une exploration illimitée mais structurée. Nos résultats suggèrent que les stacks web elles-mêmes peuvent servir de substrat évolutif pour les modèles de monde, permettant des environnents contrôlables mais ouverts. Page du projet : https://github.com/Princeton-AI2-Lab/Web-World-Models.
English
Language agents increasingly require persistent worlds in which they can act, remember, and learn. Existing approaches sit at two extremes: conventional web frameworks provide reliable but fixed contexts backed by databases, while fully generative world models aim for unlimited environments at the expense of controllability and practical engineering. In this work, we introduce the Web World Model (WWM), a middle ground where world state and ``physics'' are implemented in ordinary web code to ensure logical consistency, while large language models generate context, narratives, and high-level decisions on top of this structured latent state. We build a suite of WWMs on a realistic web stack, including an infinite travel atlas grounded in real geography, fictional galaxy explorers, web-scale encyclopedic and narrative worlds, and simulation- and game-like environments. Across these systems, we identify practical design principles for WWMs: separating code-defined rules from model-driven imagination, representing latent state as typed web interfaces, and utilizing deterministic generation to achieve unlimited but structured exploration. Our results suggest that web stacks themselves can serve as a scalable substrate for world models, enabling controllable yet open-ended environments. Project Page: https://github.com/Princeton-AI2-Lab/Web-World-Models.
PDF161December 31, 2025