ChatPaper.aiChatPaper

De Máscaras a Mundos: Um Guia do Mochileiro para Modelos de Mundo

From Masks to Worlds: A Hitchhiker's Guide to World Models

October 23, 2025
Autores: Jinbin Bai, Yu Lei, Hecong Wu, Yuchen Zhu, Shufan Li, Yi Xin, Xiangtai Li, Molei Tao, Aditya Grover, Ming-Hsuan Yang
cs.AI

Resumo

Este não é um levantamento típico de modelos de mundo; é um guia para aqueles que desejam construir mundos. Não temos como objetivo catalogar todos os artigos que já mencionaram um "modelo de mundo". Em vez disso, seguimos um caminho claro: desde os primeiros modelos mascarados que unificaram o aprendizado de representações entre modalidades, passando por arquiteturas unificadas que compartilham um único paradigma, depois para modelos generativos interativos que fecham o ciclo ação-percepção, e finalmente para sistemas aumentados por memória que sustentam mundos consistentes ao longo do tempo. Ignoramos ramificações vagamente relacionadas para focar no núcleo: o cerne generativo, o ciclo interativo e o sistema de memória. Mostramos que este é o caminho mais promissor em direção a verdadeiros modelos de mundo.
English
This is not a typical survey of world models; it is a guide for those who want to build worlds. We do not aim to catalog every paper that has ever mentioned a ``world model". Instead, we follow one clear road: from early masked models that unified representation learning across modalities, to unified architectures that share a single paradigm, then to interactive generative models that close the action-perception loop, and finally to memory-augmented systems that sustain consistent worlds over time. We bypass loosely related branches to focus on the core: the generative heart, the interactive loop, and the memory system. We show that this is the most promising path towards true world models.
PDF62December 2, 2025