기업 시스템은 학습된 세계 모델을 필요로 하는가? 동적 특성 추론을 위한 맥락의 중요성
Do Enterprise Systems Need Learned World Models? The Importance of Context to Infer Dynamics
May 12, 2026
저자: Jishnu Sethumadhavan Nair, Patrice Bechard, Rishabh Maheshwary, Surajit Dasgupta, Sravan Ramachandran, Aakash Bhagat, Shruthan Radhakrishna, Pulkit Pattnaik, Johan Obando-Ceron, Shiva Krishna Reddy Malay, Sagar Davasam, Seganrasan Subramanian, Vipul Mittal, Sridhar Krishna Nemala, Christopher Pal, Srinivas Sunkara, Sai Rajeswar
cs.AI
초록
월드 모델은 에이전트가 환경 동역학을 내재화함으로써 자신의 행동의 효과를 예측할 수 있게 한다. 그러나 엔터프라이즈 시스템에서 이러한 동역학은 종종 배포에 따라 달라지고 시간이 지남에 따라 진화하는 테넌트별 비즈니스 로직에 의해 정의되며, 이로 인해 과거 전이에 대해 훈련된 모델은 배포 변화 하에서 취약해진다. 우리는 월드 모델 문헌이 다루지 않은 질문을 제기한다: 추론 시점에 규칙을 읽을 수 있다면, 에이전트가 여전히 그 규칙을 학습해야 하는가? 우리는 전이 동역학이 구성 가능하고 읽을 수 있는 환경에서 런타임 탐색이 활성 시스템 인스턴스에 예측을 근거함으로써 오프라인 훈련을 보완한다고 주장하며, 이를 실증적으로 보여준다. 우리는 엔터프라이즈 탐색 에이전트를 제안하는데, 이는 내재화된 표현에만 의존하지 않고 시스템 구성을 읽음으로써 런타임에 관련 전이 동역학을 복구한다. 우리는 다양한 합성 환경에서 World of Workflows의 평가 방법론을 채택한, 엔터프라이즈 캐스케이드 예측을 위한 추론 중심 벤치마크인 CascadeBench를 도입하고, 이를 배포 변화 평가와 함께 사용하여 오프라인 훈련된 월드 모델이 분포 내에서는 잘 작동하지만 동역학이 변함에 따라 성능이 저하되는 반면, 탐색 기반 에이전트는 현재 인스턴스에 예측을 근거함으로써 변화 하에서 더 강건함을 보여준다. 우리의 발견은 구성 가능한 엔터프라이즈 환경에서 에이전트가 고정된 내재화된 동역학에만 의존해서는 안 되며, 런타임에 관련 전이 논리를 탐색하는 메커니즘을 통합해야 함을 시사한다.
English
World models enable agents to anticipate the effects of their actions by internalizing environment dynamics. In enterprise systems, however, these dynamics are often defined by tenant-specific business logic that varies across deployments and evolves over time, making models trained on historical transitions brittle under deployment shift. We ask a question the world-models literature has not addressed: when the rules can be read at inference time, does an agent still need to learn them? We argue, and demonstrate empirically, that in settings where transition dynamics are configurable and readable, runtime discovery complements offline training by grounding predictions in the active system instance. We propose enterprise discovery agents, which recover relevant transition dynamics at runtime by reading the system's configuration rather than relying solely on internalized representations. We introduce CascadeBench, a reasoning-focused benchmark for enterprise cascade prediction that adopts the evaluation methodology of World of Workflows on diverse synthetic environments, and use it together with deployment-shift evaluation to show that offline-trained world models can perform well in-distribution but degrade as dynamics change, whereas discovery-based agents are more robust under shift by grounding their predictions in the current instance. Our findings suggest that, in configurable enterprise environments, agents should not rely solely on fixed internalized dynamics, but should incorporate mechanisms for discovering relevant transition logic at runtime.