ChatPaper.aiChatPaper

Benötigen Unternehmenssysteme erlernte Weltmodelle? Die Bedeutung des Kontexts zur Ableitung von Dynamiken

Do Enterprise Systems Need Learned World Models? The Importance of Context to Infer Dynamics

May 12, 2026
Autoren: Jishnu Sethumadhavan Nair, Patrice Bechard, Rishabh Maheshwary, Surajit Dasgupta, Sravan Ramachandran, Aakash Bhagat, Shruthan Radhakrishna, Pulkit Pattnaik, Johan Obando-Ceron, Shiva Krishna Reddy Malay, Sagar Davasam, Seganrasan Subramanian, Vipul Mittal, Sridhar Krishna Nemala, Christopher Pal, Srinivas Sunkara, Sai Rajeswar
cs.AI

Zusammenfassung

Weltmodelle ermöglichen es Agenten, die Auswirkungen ihrer Handlungen zu antizipieren, indem sie die Dynamik der Umgebung verinnerlichen. In Unternehmenssystemen wird diese Dynamik jedoch oft durch mandantenspezifische Geschäftslogik definiert, die zwischen verschiedenen Bereitstellungen variiert und sich im Laufe der Zeit weiterentwickelt, wodurch Modelle, die auf historischen Übergängen trainiert wurden, bei einer Einsatzverschiebung anfällig werden. Wir stellen eine Frage, die die Literatur zu Weltmodellen bislang nicht behandelt hat: Wenn die Regeln zum Zeitpunkt der Inferenz gelesen werden können, muss ein Agent sie dann noch lernen? Wir argumentieren und zeigen empirisch, dass in Umgebungen, in denen Übergangsdynamiken konfigurierbar und lesbar sind, die Laufzeitentdeckung das Offline-Training ergänzt, indem sie Vorhersagen in der aktiven Systeminstanz verankert. Wir schlagen Enterprise Discovery Agents vor, die relevante Übergangsdynamiken zur Laufzeit wiederherstellen, indem sie die Konfiguration des Systems lesen, anstatt sich ausschließlich auf verinnerlichte Repräsentationen zu stützen. Wir führen CascadeBench ein, einen auf Reasoning fokussierten Benchmark für die Vorhersage von Kaskaden in Unternehmen, der die Evaluierungsmethodik von World of Workflows auf verschiedene synthetische Umgebungen überträgt, und nutzen ihn gemeinsam mit einer Evaluierung unter Einsatzverschiebung, um zu zeigen, dass offline trainierte Weltmodelle innerhalb der Verteilung gut abschneiden können, sich jedoch bei sich ändernder Dynamik verschlechtern, während entdeckungsbasierte Agenten unter Verschiebung robuster sind, da sie ihre Vorhersagen in der aktuellen Instanz verankern. Unsere Ergebnisse deuten darauf hin, dass Agenten in konfigurierbaren Unternehmensumgebungen nicht ausschließlich auf fest verinnerlichte Dynamiken vertrauen sollten, sondern Mechanismen zur Erkennung relevanter Übergangslogik zur Laufzeit integrieren müssen.
English
World models enable agents to anticipate the effects of their actions by internalizing environment dynamics. In enterprise systems, however, these dynamics are often defined by tenant-specific business logic that varies across deployments and evolves over time, making models trained on historical transitions brittle under deployment shift. We ask a question the world-models literature has not addressed: when the rules can be read at inference time, does an agent still need to learn them? We argue, and demonstrate empirically, that in settings where transition dynamics are configurable and readable, runtime discovery complements offline training by grounding predictions in the active system instance. We propose enterprise discovery agents, which recover relevant transition dynamics at runtime by reading the system's configuration rather than relying solely on internalized representations. We introduce CascadeBench, a reasoning-focused benchmark for enterprise cascade prediction that adopts the evaluation methodology of World of Workflows on diverse synthetic environments, and use it together with deployment-shift evaluation to show that offline-trained world models can perform well in-distribution but degrade as dynamics change, whereas discovery-based agents are more robust under shift by grounding their predictions in the current instance. Our findings suggest that, in configurable enterprise environments, agents should not rely solely on fixed internalized dynamics, but should incorporate mechanisms for discovering relevant transition logic at runtime.
PDF531May 14, 2026