От статических шаблонов к динамическим графам выполнения: обзор оптимизации рабочих процессов для агентов на основе больших языковых моделей

Аннотация

Системы на основе больших языковых моделей (LLM) становятся все более популярными для решения задач путем построения исполняемых рабочих процессов, которые чередуют вызовы LLM, информационный поиск, использование инструментов, выполнение кода, обновление памяти и верификацию. В данном обзоре рассматриваются современные методы проектирования и оптимизации таких рабочих процессов, которые мы трактуем как агентные вычислительные графы (ACGs). Мы систематизируем литературу на основе того, когда определяется структура рабочего процесса, где под структурой понимается то, какие компоненты или агенты присутствуют, как они зависят друг от друга и как информация передается между ними. Такой подход позволяет различать статические методы, которые фиксируют каркас многократно используемого рабочего процесса до развертывания, и динамические методы, которые выбирают, генерируют или изменяют рабочий процесс для конкретного запуска до или во время выполнения. Мы далее классифицируем предыдущие работы по трем измерениям: когда определяется структура, какая часть рабочего процесса оптимизируется и какие оценочные сигналы направляют оптимизацию (например, метрики задач, сигналы верификаторов, предпочтения или обратная связь на основе трассировки). Мы также различаем шаблоны многократно используемых рабочих процессов, реализованные графы для конкретного запуска и трассы выполнения, отделяя многократно используемые проектные решения от структур, фактически развернутых в данном запуске, и от реализованного поведения во время выполнения. Наконец, мы описываем перспективу оценки с учетом структуры, которая дополняет метрики последующих задач такими свойствами, как характеристики графа, стоимость выполнения, устойчивость и структурная вариативность для разных входных данных. Наша цель — предоставить четкую терминологию, унифицированную основу для позиционирования новых методов, более сопоставимый взгляд на существующий корпус литературы и более воспроизводимый стандарт оценки для будущих работ по оптимизации рабочих процессов для LLM-агентов.

English

Large language model (LLM)-based systems are becoming increasingly popular for solving tasks by constructing executable workflows that interleave LLM calls, information retrieval, tool use, code execution, memory updates, and verification. This survey reviews recent methods for designing and optimizing such workflows, which we treat as agentic computation graphs (ACGs). We organize the literature based on when workflow structure is determined, where structure refers to which components or agents are present, how they depend on each other, and how information flows between them. This lens distinguishes static methods, which fix a reusable workflow scaffold before deployment, from dynamic methods, which select, generate, or revise the workflow for a particular run before or during execution. We further organize prior work along three dimensions: when structure is determined, what part of the workflow is optimized, and which evaluation signals guide optimization (e.g., task metrics, verifier signals, preferences, or trace-derived feedback). We also distinguish reusable workflow templates, run-specific realized graphs, and execution traces, separating reusable design choices from the structures actually deployed in a given run and from realized runtime behavior. Finally, we outline a structure-aware evaluation perspective that complements downstream task metrics with graph-level properties, execution cost, robustness, and structural variation across inputs. Our goal is to provide a clear vocabulary, a unified framework for positioning new methods, a more comparable view of existing body of literature, and a more reproducible evaluation standard for future work in workflow optimizations for LLM agents.

От статических шаблонов к динамическим графам выполнения: обзор оптимизации рабочих процессов для агентов на основе больших языковых моделей

From Static Templates to Dynamic Runtime Graphs: A Survey of Workflow Optimization for LLM Agents

Аннотация

Support