ChatPaper.aiChatPaper

Des masques aux mondes : Guide du routard des modèles du monde

From Masks to Worlds: A Hitchhiker's Guide to World Models

October 23, 2025
papers.authors: Jinbin Bai, Yu Lei, Hecong Wu, Yuchen Zhu, Shufan Li, Yi Xin, Xiangtai Li, Molei Tao, Aditya Grover, Ming-Hsuan Yang
cs.AI

papers.abstract

Ceci n'est pas une étude classique des modèles du monde ; c'est un guide pour ceux qui souhaitent construire des mondes. Nous n'avons pas pour objectif de répertorier chaque article ayant jamais mentionné un « modèle du monde ». Au lieu de cela, nous suivons une voie claire : des premiers modèles masqués qui ont unifié l'apprentissage de représentations à travers les modalités, aux architectures unifiées qui partagent un paradigme unique, puis aux modèles génératifs interactifs qui bouclent la boucle action-perception, et enfin aux systèmes augmentés par une mémoire qui maintiennent des mondes cohérents dans le temps. Nous contournons les branches faiblement liées pour nous concentrer sur l'essentiel : le cœur génératif, la boucle interactive et le système de mémoire. Nous montrons qu'il s'agit de la voie la plus prometteuse vers de véritables modèles du monde.
English
This is not a typical survey of world models; it is a guide for those who want to build worlds. We do not aim to catalog every paper that has ever mentioned a ``world model". Instead, we follow one clear road: from early masked models that unified representation learning across modalities, to unified architectures that share a single paradigm, then to interactive generative models that close the action-perception loop, and finally to memory-augmented systems that sustain consistent worlds over time. We bypass loosely related branches to focus on the core: the generative heart, the interactive loop, and the memory system. We show that this is the most promising path towards true world models.
PDF62December 2, 2025