Kritiken an World Models
Critiques of World Models
July 7, 2025
papers.authors: Eric Xing, Mingkai Deng, Jinyu Hou, Zhiting Hu
cs.AI
papers.abstract
Das Weltmodell, der vermeintliche algorithmische Ersatz für die reale Umgebung, die biologische Agenten erleben und auf die sie einwirken, ist in den letzten Jahren zu einem aufstrebenden Thema geworden, da der Bedarf an der Entwicklung virtueller Agenten mit künstlicher (allgemeiner) Intelligenz gestiegen ist. Es gab viel Diskussion darüber, was ein Weltmodell wirklich ist, wie man es aufbaut, wie man es verwendet und wie man es bewertet. In diesem Essay, ausgehend von der Vorstellungskraft in dem berühmten Science-Fiction-Klassiker „Dune“ und inspiriert durch das Konzept des „hypothetischen Denkens“ in der psychologischen Literatur, bieten wir Kritiken zu verschiedenen Denkschulen der Weltmodellierung an und argumentieren, dass das primäre Ziel eines Weltmodells darin besteht, alle handlungsfähigen Möglichkeiten der realen Welt zur zielgerichteten Argumentation und Handlung zu simulieren. Aufbauend auf diesen Kritiken schlagen wir eine neue Architektur für ein allgemeines Weltmodell vor, basierend auf hierarchischen, mehrstufigen und gemischten kontinuierlichen/diskretisierten Darstellungen sowie einem generativen und selbstüberwachten Lernrahmen, mit einem Ausblick auf ein physikalisches, agentenbasiertes und verschachteltes (PAN) AGI-System, das durch ein solches Modell ermöglicht wird.
English
World Model, the supposed algorithmic surrogate of the real-world environment
which biological agents experience with and act upon, has been an emerging
topic in recent years because of the rising needs to develop virtual agents
with artificial (general) intelligence. There has been much debate on what a
world model really is, how to build it, how to use it, and how to evaluate it.
In this essay, starting from the imagination in the famed Sci-Fi classic Dune,
and drawing inspiration from the concept of "hypothetical thinking" in
psychology literature, we offer critiques of several schools of thoughts on
world modeling, and argue the primary goal of a world model to be simulating
all actionable possibilities of the real world for purposeful reasoning and
acting. Building on the critiques, we propose a new architecture for a
general-purpose world model, based on hierarchical, multi-level, and mixed
continuous/discrete representations, and a generative and self-supervision
learning framework, with an outlook of a Physical, Agentic, and Nested (PAN)
AGI system enabled by such a model.