Modelagem de Mundos Agênticos: Fundamentos, Capacidades, Leis e Além

Resumo

À medida que os sistemas de IA evoluem da geração de texto para a realização de objetivos por meio de interação sustentada, a capacidade de modelar a dinâmica do ambiente torna-se um gargalo central. Agentes que manipulam objetos, navegam em software, coordenam com outros ou projetam experimentos exigem modelos preditivos do ambiente, embora o termo *modelo de mundo* carregue significados diferentes entre comunidades de pesquisa. Introduzimos uma taxonomia "níveis x leis" organizada ao longo de dois eixos. O primeiro define três níveis de capacidade: **Preditivo L1**, que aprende operadores de transição local de um passo; **Simulador L2**, que os compõe em rollouts multi-etapa, condicionados por ações e que respeitam as leis do domínio; e **Evolutivo L3**, que revisa autonomamente seu próprio modelo quando as previsões falham frente a novas evidências. O segundo eixo identifica quatro regimes de leis governantes: **físico**, **digital**, **social** e **científico**. Esses regimes determinam quais restrições um modelo de mundo deve satisfazer e onde é mais provável que falhe. Usando esta estrutura, sintetizamos mais de 400 trabalhos e resumimos mais de 100 sistemas representativos, abrangendo aprendizado por reforço baseado em modelo, geração de vídeo, agentes para web e interface gráfica, simulação social multiagente e descoberta científica impulsionada por IA. Analisamos métodos, modos de falha e práticas de avaliação entre pares nível-regime, propomos princípios de avaliação centrados na decisão e um pacote de avaliação reproduzível mínimo, e delineamos orientações arquiteturais, problemas em aberto e desafios de governança. O roteiro resultante conecta comunidades anteriormente isoladas e traça um caminho desde a predição passiva do próximo passo em direção a modelos de mundo que podem simular e, em última instância, remodelar os ambientes nos quais os agentes operam.

English

As AI systems move from generating text to accomplishing goals through sustained interaction, the ability to model environment dynamics becomes a central bottleneck. Agents that manipulate objects, navigate software, coordinate with others, or design experiments require predictive environment models, yet the term world model carries different meanings across research communities. We introduce a "levels x laws" taxonomy organized along two axes. The first defines three capability levels: L1 Predictor, which learns one-step local transition operators; L2 Simulator, which composes them into multi-step, action-conditioned rollouts that respect domain laws; and L3 Evolver, which autonomously revises its own model when predictions fail against new evidence. The second identifies four governing-law regimes: physical, digital, social, and scientific. These regimes determine what constraints a world model must satisfy and where it is most likely to fail. Using this framework, we synthesize over 400 works and summarize more than 100 representative systems spanning model-based reinforcement learning, video generation, web and GUI agents, multi-agent social simulation, and AI-driven scientific discovery. We analyze methods, failure modes, and evaluation practices across level-regime pairs, propose decision-centric evaluation principles and a minimal reproducible evaluation package, and outline architectural guidance, open problems, and governance challenges. The resulting roadmap connects previously isolated communities and charts a path from passive next-step prediction toward world models that can simulate, and ultimately reshape, the environments in which agents operate.

Modelagem de Mundos Agênticos: Fundamentos, Capacidades, Leis e Além

Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond

Resumo

Support