ChatPaper.aiChatPaper

가면에서 세계로: 월드 모델을 향한 히치하이커 가이드

From Masks to Worlds: A Hitchhiker's Guide to World Models

October 23, 2025
저자: Jinbin Bai, Yu Lei, Hecong Wu, Yuchen Zhu, Shufan Li, Yi Xin, Xiangtai Li, Molei Tao, Aditya Grover, Ming-Hsuan Yang
cs.AI

초록

이 글은 세계 모델에 대한 일반적인 개론서가 아닌, 세계를 구축하고자 하는 이들을 위한 안내서입니다. 우리의 목표는 '세계 모델'을 언급한 모든 논문을 일일이 열거하는 것이 아닙니다. 대신 우리는 한 가지 명확한 길을 따라갑니다: 다양한 양식 간 표현 학습을 통합한 초기 마스킹 모델에서 시작하여, 단일 패러다임을 공유하는 통합 아키텍처로, 인지와 행동의 순환을 완성하는 상호작용적 생성 모델을 거쳐, 궁극적으로 시간이 흐름에 따라 일관된 세계를 유지하는 메모리 강화 시스템에 이르는 길입니다. 우리는 직접적 연관성이 적은 분야들은 지나쳐 핵심, 즉 생성의 본질, 상호작용 순환, 그리고 메모리 시스템에 집중합니다. 이것이 진정한 세계 모델로 가는 가장 유망한 길임을 보여줍니다.
English
This is not a typical survey of world models; it is a guide for those who want to build worlds. We do not aim to catalog every paper that has ever mentioned a ``world model". Instead, we follow one clear road: from early masked models that unified representation learning across modalities, to unified architectures that share a single paradigm, then to interactive generative models that close the action-perception loop, and finally to memory-augmented systems that sustain consistent worlds over time. We bypass loosely related branches to focus on the core: the generative heart, the interactive loop, and the memory system. We show that this is the most promising path towards true world models.
PDF62December 2, 2025