Críticas a los Modelos del Mundo
Critiques of World Models
July 7, 2025
Autores: Eric Xing, Mingkai Deng, Jinyu Hou, Zhiting Hu
cs.AI
Resumen
El Modelo del Mundo, supuesto sustituto algorítmico del entorno del mundo real que los agentes biológicos experimentan y sobre el cual actúan, ha sido un tema emergente en los últimos años debido a la creciente necesidad de desarrollar agentes virtuales con inteligencia artificial (general). Ha habido mucho debate sobre qué es realmente un modelo del mundo, cómo construirlo, cómo utilizarlo y cómo evaluarlo. En este ensayo, partiendo de la imaginación presente en el clásico de ciencia ficción Dune y tomando inspiración del concepto de "pensamiento hipotético" en la literatura psicológica, ofrecemos críticas a varias escuelas de pensamiento sobre el modelado del mundo y argumentamos que el objetivo principal de un modelo del mundo es simular todas las posibilidades accionables del mundo real para el razonamiento y la actuación con propósito. Basándonos en estas críticas, proponemos una nueva arquitectura para un modelo del mundo de propósito general, basada en representaciones jerárquicas, multinivel y mixtas (continuas/discretas), y un marco de aprendizaje generativo y de auto-supervisión, con una perspectiva de un sistema de AGI Físico, Agéntico y Anidado (PAN) habilitado por dicho modelo.
English
World Model, the supposed algorithmic surrogate of the real-world environment
which biological agents experience with and act upon, has been an emerging
topic in recent years because of the rising needs to develop virtual agents
with artificial (general) intelligence. There has been much debate on what a
world model really is, how to build it, how to use it, and how to evaluate it.
In this essay, starting from the imagination in the famed Sci-Fi classic Dune,
and drawing inspiration from the concept of "hypothetical thinking" in
psychology literature, we offer critiques of several schools of thoughts on
world modeling, and argue the primary goal of a world model to be simulating
all actionable possibilities of the real world for purposeful reasoning and
acting. Building on the critiques, we propose a new architecture for a
general-purpose world model, based on hierarchical, multi-level, and mixed
continuous/discrete representations, and a generative and self-supervision
learning framework, with an outlook of a Physical, Agentic, and Nested (PAN)
AGI system enabled by such a model.