ChatPaper.aiChatPaper

정적 템플릿에서 동적 런타임 그래프로: LLM 에이전트 워크플로우 최적화 기술 동향

From Static Templates to Dynamic Runtime Graphs: A Survey of Workflow Optimization for LLM Agents

March 23, 2026
저자: Ling Yue, Kushal Raj Bhandari, Ching-Yun Ko, Dhaval Patel, Shuxin Lin, Nianjun Zhou, Jianxi Gao, Pin-Yu Chen, Shaowu Pan
cs.AI

초록

대규모 언어 모델(LLM) 기반 시스템은 LLM 호출, 정보 검색, 도구 사용, 코드 실행, 메모리 갱신, 검증 등을 연계하여 실행 가능한 워크플로우를 구성함으로써 과제를 해결하는 데 점점 더 널리 활용되고 있습니다. 본 고에서는 이러한 워크플로우를 에이전트 계산 그래프(ACGs)로 간주하고, 이를 설계하고 최적화하는 최근 기법들을 검토합니다. 우리는 워크플로우 구조(즉, 어떤 구성 요소나 에이전트가 존재하는지, 이들이 서로 어떻게 의존하는지, 정보가 그들 사이를 어떻게 흐르는지)가 결정되는 시점에 따라 문헌을 체계화합니다. 이러한 관점은 재사용 가능한 워크플로우 골격을 배포 전에 고정하는 정적(static) 방법과, 특정 실행 전이나 실행 중에 워크플로우를 선택, 생성 또는 수정하는 동적(dynamic) 방법을 구분합니다. 우리는 또한 기존 연구를 구조가 결정되는 시점(when), 워크플로우의 어떤 부분이 최적화되는지(what), 그리고 어떤 평가 신호(예: 과제 지표, 검증기 신호, 선호도, 또는 실행 추적에서 도출된 피드백)가 최적화를 안내하는지(which)라는 세 가지 차원을 따라 추가로 체계화합니다. 또한 재사용 가능한 워크플로우 템플릿, 실행별로 구현된 그래프, 실행 추적을 구분하여, 재사용 가능한 설계 선택사항과 특정 실행에서 실제로 배포된 구조, 그리고 실현된 런타임 동작을 분리합니다. 마지막으로, 하류 과제 지표를 그래프 수준의 속성, 실행 비용, 강건성, 그리고 입력에 따른 구조적 변동과 함께 보완하는 구조 인식 평가 관점을 제시합니다. 우리의 목표는 명확한 용어 체계, 새로운 방법론을 위치시키기 위한 통합 프레임워크, 기존 문헌에 대한 보다 비교 가능한 시각, 그리고 LLM 에이전트 워크플로우 최적화 분야의 향후 연구를 위한 보다 재현 가능한 평가 기준을 제공하는 것입니다.
English
Large language model (LLM)-based systems are becoming increasingly popular for solving tasks by constructing executable workflows that interleave LLM calls, information retrieval, tool use, code execution, memory updates, and verification. This survey reviews recent methods for designing and optimizing such workflows, which we treat as agentic computation graphs (ACGs). We organize the literature based on when workflow structure is determined, where structure refers to which components or agents are present, how they depend on each other, and how information flows between them. This lens distinguishes static methods, which fix a reusable workflow scaffold before deployment, from dynamic methods, which select, generate, or revise the workflow for a particular run before or during execution. We further organize prior work along three dimensions: when structure is determined, what part of the workflow is optimized, and which evaluation signals guide optimization (e.g., task metrics, verifier signals, preferences, or trace-derived feedback). We also distinguish reusable workflow templates, run-specific realized graphs, and execution traces, separating reusable design choices from the structures actually deployed in a given run and from realized runtime behavior. Finally, we outline a structure-aware evaluation perspective that complements downstream task metrics with graph-level properties, execution cost, robustness, and structural variation across inputs. Our goal is to provide a clear vocabulary, a unified framework for positioning new methods, a more comparable view of existing body of literature, and a more reproducible evaluation standard for future work in workflow optimizations for LLM agents.
PDF411March 26, 2026