Нуждаются ли корпоративные системы в обученных моделях мира? Важность контекста для вывода динамики.

Аннотация

Мировые модели позволяют агентам предвидеть последствия своих действий за счет интернализации динамики среды. Однако в корпоративных системах эта динамика часто определяется специфичной для арендатора бизнес-логикой, которая различается в разных развертываниях и меняется со временем, что делает модели, обученные на исторических переходах, хрупкими при изменении условий развертывания. Мы задаем вопрос, который не рассматривался в литературе по мировым моделям: если правила можно считать во время вывода, нужно ли агенту все равно изучать их? Мы утверждаем и демонстрируем эмпирически, что в условиях, где динамика переходов настраиваема и читаема, обнаружение во время выполнения дополняет офлайн-обучение, связывая прогнозы с активным экземпляром системы. Мы предлагаем корпоративных агентов обнаружения, которые восстанавливают релевантную динамику переходов во время выполнения, считывая конфигурацию системы, а не полагаясь исключительно на интернализированные представления. Мы представляем CascadeBench — ориентированный на рассуждение бенчмарк для прогнозирования корпоративных каскадов, который использует методологию оценки World of Workflows в разнообразных синтетических средах, и применяем его вместе с оценкой сдвига развертывания, чтобы показать, что обученные офлайн мировые модели могут хорошо работать в распределении, но ухудшаются при изменении динамики, тогда как агенты на основе обнаружения более устойчивы к сдвигу, поскольку основывают свои прогнозы на текущем экземпляре. Наши результаты показывают, что в настраиваемых корпоративных средах агенты не должны полагаться исключительно на фиксированную интернализированную динамику, а должны включать механизмы для обнаружения релевантной логики переходов во время выполнения.

English

World models enable agents to anticipate the effects of their actions by internalizing environment dynamics. In enterprise systems, however, these dynamics are often defined by tenant-specific business logic that varies across deployments and evolves over time, making models trained on historical transitions brittle under deployment shift. We ask a question the world-models literature has not addressed: when the rules can be read at inference time, does an agent still need to learn them? We argue, and demonstrate empirically, that in settings where transition dynamics are configurable and readable, runtime discovery complements offline training by grounding predictions in the active system instance. We propose enterprise discovery agents, which recover relevant transition dynamics at runtime by reading the system's configuration rather than relying solely on internalized representations. We introduce CascadeBench, a reasoning-focused benchmark for enterprise cascade prediction that adopts the evaluation methodology of World of Workflows on diverse synthetic environments, and use it together with deployment-shift evaluation to show that offline-trained world models can perform well in-distribution but degrade as dynamics change, whereas discovery-based agents are more robust under shift by grounding their predictions in the current instance. Our findings suggest that, in configurable enterprise environments, agents should not rely solely on fixed internalized dynamics, but should incorporate mechanisms for discovering relevant transition logic at runtime.

Нуждаются ли корпоративные системы в обученных моделях мира? Важность контекста для вывода динамики.

Do Enterprise Systems Need Learned World Models? The Importance of Context to Infer Dynamics

Аннотация

Support