ChatPaper.aiChatPaper

Веб-мировые модели

Web World Models

December 29, 2025
Авторы: Jichen Feng, Yifan Zhang, Chenggong Zhang, Yifu Lu, Shilong Liu, Mengdi Wang
cs.AI

Аннотация

Языковым агентам все чаще требуются устойчивые миры, в которых они могут действовать, запоминать и обучаться. Существующие подходы находятся на двух полюсах: традиционные веб-фреймворки предоставляют надежные, но фиксированные контексты, основанные на базах данных, в то время как полностью генеративные модели мира стремятся к неограниченным средам за счет управляемости и практической реализуемости. В данной работе мы представляем Веб-Модель Мира (Web World Model, WWM) — промежуточный подход, в котором состояние мира и его «физика» реализованы в стандартном веб-коде для обеспечения логической согласованности, а большие языковые модели генерируют контекст, нарративы и стратегические решения на основе этого структурированного латентного состояния. Мы создали набор WWM на реалистичном веб-стеке, включая бесконечный атлас путешествий, основанный на реальной географии, вымышленных исследователей галактик, веб-масштабные энциклопедические и нарративные миры, а также среды, подобные симуляциям и играм. На примере этих систем мы выявили практические принципы проектирования WWM: разделение правил, задаваемых кодом, и моделируемого воображения, представление латентного состояния в виде типизированных веб-интерфейсов и использование детерминированной генерации для достижения неограниченного, но структурированного исследования. Наши результаты позволяют предположить, что сами веб-стеки могут служить масштабируемой основой для моделей мира, обеспечивая управляемые, но открытые среды. Страница проекта: https://github.com/Princeton-AI2-Lab/Web-World-Models.
English
Language agents increasingly require persistent worlds in which they can act, remember, and learn. Existing approaches sit at two extremes: conventional web frameworks provide reliable but fixed contexts backed by databases, while fully generative world models aim for unlimited environments at the expense of controllability and practical engineering. In this work, we introduce the Web World Model (WWM), a middle ground where world state and ``physics'' are implemented in ordinary web code to ensure logical consistency, while large language models generate context, narratives, and high-level decisions on top of this structured latent state. We build a suite of WWMs on a realistic web stack, including an infinite travel atlas grounded in real geography, fictional galaxy explorers, web-scale encyclopedic and narrative worlds, and simulation- and game-like environments. Across these systems, we identify practical design principles for WWMs: separating code-defined rules from model-driven imagination, representing latent state as typed web interfaces, and utilizing deterministic generation to achieve unlimited but structured exploration. Our results suggest that web stacks themselves can serve as a scalable substrate for world models, enabling controllable yet open-ended environments. Project Page: https://github.com/Princeton-AI2-Lab/Web-World-Models.
PDF161December 31, 2025