AgentSPEX: Un Linguaggio per la Specifica ed Esecuzione di Agenti

Abstract

I sistemi agenti basati su modelli linguistici si basano comunemente su prompt reattivi, in cui una singola istruzione guida il modello attraverso una sequenza aperta di passaggi di ragionamento e utilizzo di strumenti, lasciando impliciti il flusso di controllo e lo stato intermedio e rendendo il comportamento dell'agente potenzialmente difficile da controllare. Framework di orchestrazione come LangGraph, DSPy e CrewAI impongono una maggiore struttura attraverso definizioni esplicite del flusso di lavoro, ma accoppiano strettamente la logica del flusso di lavoro con Python, rendendo gli agenti difficili da mantenere e modificare. In questo articolo, introduciamo AgentSPEX, un Linguaggio di Specifica ed Esecuzione per Agenti per definire flussi di lavoro di agenti LLM con un flusso di controllo esplicito e una struttura modulare, insieme a un ambiente di esecuzione personalizzabile. AgentSPEX supporta step tipizzati, diramazioni e cicli, esecuzione parallela, sottomoduli riutilizzabili e una gestione esplicita dello stato, e questi flussi di lavoro vengono eseguiti all'interno di un ambiente di esecuzione che fornisce accesso agli strumenti, un ambiente virtuale sandbox e supporto per checkpoint, verifica e registrazione. Inoltre, forniamo un editor visivo con viste sincronizzate di grafo e flusso di lavoro per la creazione e l'ispezione. Includiamo agenti pronti all'uso per la ricerca approfondita e la ricerca scientifica e valutiamo AgentSPEX su 7 benchmark. Infine, dimostriamo attraverso uno studio utente che AgentSPEX fornisce un paradigma di creazione del flusso di lavoro più interpretabile e accessibile rispetto a un popolare framework agente esistente.

English

Language-model agent systems commonly rely on reactive prompting, in which a single instruction guides the model through an open-ended sequence of reasoning and tool-use steps, leaving control flow and intermediate state implicit and making agent behavior potentially difficult to control. Orchestration frameworks such as LangGraph, DSPy, and CrewAI impose greater structure through explicit workflow definitions, but tightly couple workflow logic with Python, making agents difficult to maintain and modify. In this paper, we introduce AgentSPEX, an Agent SPecification and EXecution Language for specifying LLM-agent workflows with explicit control flow and modular structure, along with a customizable agent harness. AgentSPEX supports typed steps, branching and loops, parallel execution, reusable submodules, and explicit state management, and these workflows execute within an agent harness that provides tool access, a sandboxed virtual environment, and support for checkpointing, verification, and logging. Furthermore, we provide a visual editor with synchronized graph and workflow views for authoring and inspection. We include ready-to-use agents for deep research and scientific research, and we evaluate AgentSPEX on 7 benchmarks. Finally, we show through a user study that AgentSPEX provides a more interpretable and accessible workflow-authoring paradigm than a popular existing agent framework.

AgentSPEX: Un Linguaggio per la Specifica ed Esecuzione di Agenti

AgentSPEX: An Agent SPecification and EXecution Language

Abstract

Support