ChatPaper.aiChatPaper

Les systèmes d'entreprise ont-ils besoin de modèles du monde appris ? L'importance du contexte pour inférer les dynamiques

Do Enterprise Systems Need Learned World Models? The Importance of Context to Infer Dynamics

May 12, 2026
Auteurs: Jishnu Sethumadhavan Nair, Patrice Bechard, Rishabh Maheshwary, Surajit Dasgupta, Sravan Ramachandran, Aakash Bhagat, Shruthan Radhakrishna, Pulkit Pattnaik, Johan Obando-Ceron, Shiva Krishna Reddy Malay, Sagar Davasam, Seganrasan Subramanian, Vipul Mittal, Sridhar Krishna Nemala, Christopher Pal, Srinivas Sunkara, Sai Rajeswar
cs.AI

Résumé

Les modèles du monde permettent aux agents d'anticiper les effets de leurs actions en internalisant la dynamique de l'environnement. Dans les systèmes d'entreprise, cependant, cette dynamique est souvent définie par une logique métier spécifique au locataire qui varie selon les déploiements et évolue dans le temps, rendant les modèles entraînés sur des transitions historiques fragiles face au changement de déploiement. Nous posons une question que la littérature sur les modèles du monde n'a pas abordée : lorsque les règles peuvent être lues au moment de l'inférence, un agent a-t-il encore besoin de les apprendre ? Nous soutenons, et démontrons empiriquement, que dans les contextes où la dynamique de transition est configurable et lisible, la découverte au moment de l'exécution complète l'entraînement hors ligne en ancrant les prédictions dans l'instance active du système. Nous proposons des agents de découverte d'entreprise, qui récupèrent la dynamique de transition pertinente au moment de l'exécution en lisant la configuration du système plutôt qu'en se fiant uniquement aux représentations internalisées. Nous introduisons CascadeBench, un banc d'essai axé sur le raisonnement pour la prédiction de cascades en entreprise qui adopte la méthodologie d'évaluation de World of Workflows sur divers environnements synthétiques, et l'utilisons conjointement avec une évaluation sous changement de déploiement pour montrer que les modèles du monde entraînés hors ligne peuvent bien performer dans la distribution mais se dégradent lorsque la dynamique change, tandis que les agents basés sur la découverte sont plus robustes face au changement en ancrant leurs prédictions dans l'instance courante. Nos résultats suggèrent que, dans les environnements d'entreprise configurables, les agents ne devraient pas se fier uniquement à une dynamique internalisée fixe, mais devraient intégrer des mécanismes pour découvrir la logique de transition pertinente au moment de l'exécution.
English
World models enable agents to anticipate the effects of their actions by internalizing environment dynamics. In enterprise systems, however, these dynamics are often defined by tenant-specific business logic that varies across deployments and evolves over time, making models trained on historical transitions brittle under deployment shift. We ask a question the world-models literature has not addressed: when the rules can be read at inference time, does an agent still need to learn them? We argue, and demonstrate empirically, that in settings where transition dynamics are configurable and readable, runtime discovery complements offline training by grounding predictions in the active system instance. We propose enterprise discovery agents, which recover relevant transition dynamics at runtime by reading the system's configuration rather than relying solely on internalized representations. We introduce CascadeBench, a reasoning-focused benchmark for enterprise cascade prediction that adopts the evaluation methodology of World of Workflows on diverse synthetic environments, and use it together with deployment-shift evaluation to show that offline-trained world models can perform well in-distribution but degrade as dynamics change, whereas discovery-based agents are more robust under shift by grounding their predictions in the current instance. Our findings suggest that, in configurable enterprise environments, agents should not rely solely on fixed internalized dynamics, but should incorporate mechanisms for discovering relevant transition logic at runtime.
PDF531May 14, 2026