Da Modelli Statici a Grafi Dinamici di Runtime: Una Rassegna sull'Ottimizzazione dei Flussi di Lavoro per Agenti LLM

Abstract

I sistemi basati su grandi modelli linguistici (LLM) stanno diventando sempre più popolari per risolvere compiti attraverso la costruzione di workflow eseguibili che intercalano chiamate agli LLM, recupero di informazioni, uso di strumenti, esecuzione di codice, aggiornamenti della memoria e verifica. Questa rassegna esamina i metodi recenti per progettare e ottimizzare tali workflow, che trattiamo come grafi computazionali agentivi (ACG). Organizziamo la letteratura in base a quando viene determinata la struttura del workflow, dove per struttura si intende quali componenti o agenti sono presenti, come dipendono l'uno dall'altro e come le informazioni fluiscono tra di essi. Questa lente distingue i metodi statici, che fissano un'impalcatura di workflow riutilizzabile prima del dispiegamento, dai metodi dinamici, che selezionano, generano o revisionano il workflow per una specifica esecuzione prima o durante la sua realizzazione. Organizziamo ulteriormente il lavoro precedente lungo tre dimensioni: quando viene determinata la struttura, quale parte del workflow viene ottimizzata e quali segnali di valutazione guidano l'ottimizzazione (ad esempio, metriche del compito, segnali di verifica, preferenze o feedback derivati dalle tracce). Distinguiamo anche modelli di workflow riutilizzabili, grafi realizzati specifici per una esecuzione e tracce di esecuzione, separando le scelte progettuali riutilizzabili dalle strutture effettivamente dispiegate in una determinata esecuzione e dal comportamento runtime realizzato. Infine, delineiamo una prospettiva di valutazione consapevole della struttura che affianca alle metriche del compito finale proprietà a livello di grafo, costo di esecuzione, robustezza e variazione strutturale tra i diversi input. Il nostro obiettivo è fornire un vocabolario chiaro, un framework unificato per posizionare nuovi metodi, una visione più comparabile della letteratura esistente e uno standard di valutazione più riproducibile per i lavori futuri sull'ottimizzazione dei workflow per agenti LLM.

English

Large language model (LLM)-based systems are becoming increasingly popular for solving tasks by constructing executable workflows that interleave LLM calls, information retrieval, tool use, code execution, memory updates, and verification. This survey reviews recent methods for designing and optimizing such workflows, which we treat as agentic computation graphs (ACGs). We organize the literature based on when workflow structure is determined, where structure refers to which components or agents are present, how they depend on each other, and how information flows between them. This lens distinguishes static methods, which fix a reusable workflow scaffold before deployment, from dynamic methods, which select, generate, or revise the workflow for a particular run before or during execution. We further organize prior work along three dimensions: when structure is determined, what part of the workflow is optimized, and which evaluation signals guide optimization (e.g., task metrics, verifier signals, preferences, or trace-derived feedback). We also distinguish reusable workflow templates, run-specific realized graphs, and execution traces, separating reusable design choices from the structures actually deployed in a given run and from realized runtime behavior. Finally, we outline a structure-aware evaluation perspective that complements downstream task metrics with graph-level properties, execution cost, robustness, and structural variation across inputs. Our goal is to provide a clear vocabulary, a unified framework for positioning new methods, a more comparable view of existing body of literature, and a more reproducible evaluation standard for future work in workflow optimizations for LLM agents.

Da Modelli Statici a Grafi Dinamici di Runtime: Una Rassegna sull'Ottimizzazione dei Flussi di Lavoro per Agenti LLM

From Static Templates to Dynamic Runtime Graphs: A Survey of Workflow Optimization for LLM Agents

Abstract

Support