AgentSPEX: Un Lenguaje de ESPecificación y EjeCución de Agentes

Resumen

Los sistemas de agentes basados en modelos de lenguaje suelen depender de la inducción reactiva, en la que una única instrucción guía al modelo a través de una secuencia abierta de pasos de razonamiento y uso de herramientas, dejando el flujo de control y el estado intermedio implícitos y haciendo que el comportamiento del agente sea potencialmente difícil de controlar. Los marcos de orquestación como LangGraph, DSPy y CrewAI imponen una mayor estructura mediante definiciones explícitas de flujos de trabajo, pero acoplan estrechamente la lógica del flujo de trabajo con Python, lo que dificulta el mantenimiento y la modificación de los agentes. En este artículo, presentamos AgentSPEX, un Lenguaje de ESPecificación y EXecución de Agentes para especificar flujos de trabajo de agentes LLM con flujo de control explícito y estructura modular, junto con un entorno de ejecución de agentes personalizable. AgentSPEX admite pasos tipados, bifurcaciones y bucles, ejecución en paralelo, submódulos reutilizables y gestión explícita del estado, y estos flujos de trabajo se ejecutan dentro de un entorno que proporciona acceso a herramientas, un entorno virtual aislado y soporte para puntos de control, verificación y registro. Además, proporcionamos un editor visual con vistas sincronizadas de grafo y flujo de trabajo para su creación e inspección. Incluimos agentes listos para usar para investigación profunda e investigación científica, y evaluamos AgentSPEX en 7 puntos de referencia. Finalmente, demostramos mediante un estudio de usuario que AgentSPEX proporciona un paradigma de creación de flujos de trabajo más interpretable y accesible que un marco de agente popular existente.

English

Language-model agent systems commonly rely on reactive prompting, in which a single instruction guides the model through an open-ended sequence of reasoning and tool-use steps, leaving control flow and intermediate state implicit and making agent behavior potentially difficult to control. Orchestration frameworks such as LangGraph, DSPy, and CrewAI impose greater structure through explicit workflow definitions, but tightly couple workflow logic with Python, making agents difficult to maintain and modify. In this paper, we introduce AgentSPEX, an Agent SPecification and EXecution Language for specifying LLM-agent workflows with explicit control flow and modular structure, along with a customizable agent harness. AgentSPEX supports typed steps, branching and loops, parallel execution, reusable submodules, and explicit state management, and these workflows execute within an agent harness that provides tool access, a sandboxed virtual environment, and support for checkpointing, verification, and logging. Furthermore, we provide a visual editor with synchronized graph and workflow views for authoring and inspection. We include ready-to-use agents for deep research and scientific research, and we evaluate AgentSPEX on 7 benchmarks. Finally, we show through a user study that AgentSPEX provides a more interpretable and accessible workflow-authoring paradigm than a popular existing agent framework.

AgentSPEX: Un Lenguaje de ESPecificación y EjeCución de Agentes

AgentSPEX: An Agent SPecification and EXecution Language

Resumen

Support