De las Máscaras a los Mundos: Una Guía del Autoestopista para los Modelos del Mundo.
From Masks to Worlds: A Hitchhiker's Guide to World Models
October 23, 2025
Autores: Jinbin Bai, Yu Lei, Hecong Wu, Yuchen Zhu, Shufan Li, Yi Xin, Xiangtai Li, Molei Tao, Aditya Grover, Ming-Hsuan Yang
cs.AI
Resumen
Esta no es una encuesta típica sobre modelos del mundo; es una guía para quienes
desean construir mundos. No pretendemos catalogar cada artículo que haya mencionado
un "modelo del mundo". En su lugar, seguimos un camino claro: desde los primeros
modelos enmascarados que unificaron el aprendizaje de representaciones entre
modalidades, hasta las arquitecturas unificadas que comparten un único paradigma,
pasando por los modelos generativos interactivos que cierran el ciclo
acción-percepción, y finalmente hasta los sistemas aumentados con memoria que
mantienen mundos consistentes en el tiempo. Omitimos ramas vagamente relacionadas
para centrarnos en el núcleo: el corazón generativo, el ciclo interactivo y el
sistema de memoria. Demostramos que este es el camino más prometedor hacia los
verdaderos modelos del mundo.
English
This is not a typical survey of world models; it is a guide for those who
want to build worlds. We do not aim to catalog every paper that has ever
mentioned a ``world model". Instead, we follow one clear road: from early
masked models that unified representation learning across modalities, to
unified architectures that share a single paradigm, then to interactive
generative models that close the action-perception loop, and finally to
memory-augmented systems that sustain consistent worlds over time. We bypass
loosely related branches to focus on the core: the generative heart, the
interactive loop, and the memory system. We show that this is the most
promising path towards true world models.