Критика моделей мира
Critiques of World Models
July 7, 2025
Авторы: Eric Xing, Mingkai Deng, Jinyu Hou, Zhiting Hu
cs.AI
Аннотация
Модель мира, предполагаемый алгоритмический суррогат реальной среды, с которой взаимодействуют и на которую воздействуют биологические агенты, в последние годы становится все более актуальной темой в связи с растущей потребностью в разработке виртуальных агентов с искусственным (общим) интеллектом. Вокруг того, что такое модель мира, как ее построить, как использовать и как оценивать, ведется множество дискуссий. В этом эссе, начиная с воображения, представленного в знаменитом научно-фантастическом произведении "Дюна", и черпая вдохновение из концепции "гипотетического мышления" в психологической литературе, мы предлагаем критический анализ нескольких школ мысли, связанных с моделированием мира, и утверждаем, что основная цель модели мира заключается в симуляции всех возможных действий в реальном мире для целенаправленного рассуждения и действия. На основе этой критики мы предлагаем новую архитектуру универсальной модели мира, основанную на иерархических, многоуровневых и смешанных непрерывных/дискретных представлениях, а также на генеративной и самообучающейся структуре, с перспективой создания системы искусственного общего интеллекта (AGI), основанной на физических, агентных и вложенных (PAN) принципах, реализуемых с помощью такой модели.
English
World Model, the supposed algorithmic surrogate of the real-world environment
which biological agents experience with and act upon, has been an emerging
topic in recent years because of the rising needs to develop virtual agents
with artificial (general) intelligence. There has been much debate on what a
world model really is, how to build it, how to use it, and how to evaluate it.
In this essay, starting from the imagination in the famed Sci-Fi classic Dune,
and drawing inspiration from the concept of "hypothetical thinking" in
psychology literature, we offer critiques of several schools of thoughts on
world modeling, and argue the primary goal of a world model to be simulating
all actionable possibilities of the real world for purposeful reasoning and
acting. Building on the critiques, we propose a new architecture for a
general-purpose world model, based on hierarchical, multi-level, and mixed
continuous/discrete representations, and a generative and self-supervision
learning framework, with an outlook of a Physical, Agentic, and Nested (PAN)
AGI system enabled by such a model.