ChatPaper.aiChatPaper

De las Máscaras a los Mundos: Una Guía del Autoestopista para los Modelos del Mundo.

From Masks to Worlds: A Hitchhiker's Guide to World Models

October 23, 2025
Autores: Jinbin Bai, Yu Lei, Hecong Wu, Yuchen Zhu, Shufan Li, Yi Xin, Xiangtai Li, Molei Tao, Aditya Grover, Ming-Hsuan Yang
cs.AI

Resumen

Esta no es una encuesta típica sobre modelos del mundo; es una guía para quienes desean construir mundos. No pretendemos catalogar cada artículo que haya mencionado un "modelo del mundo". En su lugar, seguimos un camino claro: desde los primeros modelos enmascarados que unificaron el aprendizaje de representaciones entre modalidades, hasta las arquitecturas unificadas que comparten un único paradigma, pasando por los modelos generativos interactivos que cierran el ciclo acción-percepción, y finalmente hasta los sistemas aumentados con memoria que mantienen mundos consistentes en el tiempo. Omitimos ramas vagamente relacionadas para centrarnos en el núcleo: el corazón generativo, el ciclo interactivo y el sistema de memoria. Demostramos que este es el camino más prometedor hacia los verdaderos modelos del mundo.
English
This is not a typical survey of world models; it is a guide for those who want to build worlds. We do not aim to catalog every paper that has ever mentioned a ``world model". Instead, we follow one clear road: from early masked models that unified representation learning across modalities, to unified architectures that share a single paradigm, then to interactive generative models that close the action-perception loop, and finally to memory-augmented systems that sustain consistent worlds over time. We bypass loosely related branches to focus on the core: the generative heart, the interactive loop, and the memory system. We show that this is the most promising path towards true world models.
PDF62December 2, 2025