ChatPaper.aiChatPaper

От масок к мирам: Автостопом по моделям миров.

From Masks to Worlds: A Hitchhiker's Guide to World Models

October 23, 2025
Авторы: Jinbin Bai, Yu Lei, Hecong Wu, Yuchen Zhu, Shufan Li, Yi Xin, Xiangtai Li, Molei Tao, Aditya Grover, Ming-Hsuan Yang
cs.AI

Аннотация

Это не обзор мировых моделей в традиционном понимании; это руководство для тех, кто хочет создавать миры. Наша цель — не каталогизировать каждую работу, где упоминалась «мировая модель». Вместо этого мы следуем чёткому пути: от ранних маскированных моделей, унифицировавших обучение представлений для разных модальностей, к унифицированным архитектурам, разделяющим единую парадигму, затем к интерактивным генеративным моделям, замыкающим петлю «восприятие-действие», и, наконец, к системам с расширенной памятью, которые поддерживают целостность миров во времени. Мы оставляем в стороне слабо связанные направления, чтобы сосредоточиться на главном: генеративном ядре, интерактивной петле и системе памяти. Мы показываем, что это — наиболее перспективный путь к созданию подлинных мировых моделей.
English
This is not a typical survey of world models; it is a guide for those who want to build worlds. We do not aim to catalog every paper that has ever mentioned a ``world model". Instead, we follow one clear road: from early masked models that unified representation learning across modalities, to unified architectures that share a single paradigm, then to interactive generative models that close the action-perception loop, and finally to memory-augmented systems that sustain consistent worlds over time. We bypass loosely related branches to focus on the core: the generative heart, the interactive loop, and the memory system. We show that this is the most promising path towards true world models.
PDF62December 2, 2025