ChatPaper.aiChatPaper

¿Necesitan los sistemas empresariales modelos del mundo aprendidos? La importancia del contexto para inferir dinámicas.

Do Enterprise Systems Need Learned World Models? The Importance of Context to Infer Dynamics

May 12, 2026
Autores: Jishnu Sethumadhavan Nair, Patrice Bechard, Rishabh Maheshwary, Surajit Dasgupta, Sravan Ramachandran, Aakash Bhagat, Shruthan Radhakrishna, Pulkit Pattnaik, Johan Obando-Ceron, Shiva Krishna Reddy Malay, Sagar Davasam, Seganrasan Subramanian, Vipul Mittal, Sridhar Krishna Nemala, Christopher Pal, Srinivas Sunkara, Sai Rajeswar
cs.AI

Resumen

Los modelos del mundo permiten a los agentes anticipar los efectos de sus acciones al internalizar las dinámicas del entorno. Sin embargo, en sistemas empresariales, estas dinámicas suelen estar definidas por una lógica de negocio específica del inquilino que varía entre despliegues y evoluciona con el tiempo, lo que hace que los modelos entrenados en transiciones históricas se vuelvan frágiles ante cambios de despliegue. Planteamos una pregunta que la literatura sobre modelos del mundo no ha abordado: cuando las reglas pueden leerse en tiempo de inferencia, ¿necesita aún el agente aprenderlas? Argumentamos, y demostramos empíricamente, que en entornos donde las dinámicas de transición son configurables y legibles, el descubrimiento en tiempo de ejecución complementa el entrenamiento fuera de línea al fundamentar las predicciones en la instancia activa del sistema. Proponemos los agentes de descubrimiento empresarial, que recuperan las dinámicas de transición relevantes en tiempo de ejecución mediante la lectura de la configuración del sistema, en lugar de depender únicamente de representaciones internalizadas. Introducimos CascadeBench, un punto de referencia centrado en el razonamiento para la predicción de cascadas empresariales que adopta la metodología de evaluación de World of Workflows en entornos sintéticos diversos, y lo utilizamos junto con una evaluación de cambio de despliegue para demostrar que los modelos del mundo entrenados fuera de línea pueden desempeñarse bien dentro de la distribución, pero se degradan a medida que las dinámicas cambian, mientras que los agentes basados en descubrimiento son más robustos ante cambios al fundamentar sus predicciones en la instancia actual. Nuestros hallazgos sugieren que, en entornos empresariales configurables, los agentes no deberían depender únicamente de dinámicas internalizadas fijas, sino que deberían incorporar mecanismos para descubrir la lógica de transición relevante en tiempo de ejecución.
English
World models enable agents to anticipate the effects of their actions by internalizing environment dynamics. In enterprise systems, however, these dynamics are often defined by tenant-specific business logic that varies across deployments and evolves over time, making models trained on historical transitions brittle under deployment shift. We ask a question the world-models literature has not addressed: when the rules can be read at inference time, does an agent still need to learn them? We argue, and demonstrate empirically, that in settings where transition dynamics are configurable and readable, runtime discovery complements offline training by grounding predictions in the active system instance. We propose enterprise discovery agents, which recover relevant transition dynamics at runtime by reading the system's configuration rather than relying solely on internalized representations. We introduce CascadeBench, a reasoning-focused benchmark for enterprise cascade prediction that adopts the evaluation methodology of World of Workflows on diverse synthetic environments, and use it together with deployment-shift evaluation to show that offline-trained world models can perform well in-distribution but degrade as dynamics change, whereas discovery-based agents are more robust under shift by grounding their predictions in the current instance. Our findings suggest that, in configurable enterprise environments, agents should not rely solely on fixed internalized dynamics, but should incorporate mechanisms for discovering relevant transition logic at runtime.
PDF531May 14, 2026