AgentSPEX: Uma Linguagem de Especificação e Execução de Agentes

Resumo

Os sistemas de agentes baseados em modelos de linguagem geralmente dependem de *prompting* reativo, no qual uma única instrução guia o modelo por uma sequência aberta de etapas de raciocínio e uso de ferramentas, deixando o fluxo de controle e o estado intermediário implícitos e tornando o comportamento do agente potencialmente difícil de controlar. Estruturas de orquestração como LangGraph, DSPy e CrewAI impõem maior estruturação por meio de definições explícitas de fluxo de trabalho, mas acoplam fortemente a lógica do fluxo de trabalho ao Python, tornando os agentes difíceis de manter e modificar. Neste artigo, apresentamos o AgentSPEX, uma Linguagem de ESPecificação e EXecução de Agentes para definir fluxos de trabalho de agentes de LLM com fluxo de controle explícito e estrutura modular, juntamente com um *harness* de agente personalizável. O AgentSPEX suporta etapas tipadas, ramificação e loops, execução paralela, submódulos reutilizáveis e gerenciamento explícito de estado, e esses fluxos de trabalho são executados dentro de um *harness* de agente que fornece acesso a ferramentas, um ambiente virtual isolado (*sandbox*) e suporte para *checkpointing*, verificação e registro de logs. Além disso, fornecemos um editor visual com visualizações sincronizadas de grafo e fluxo de trabalho para criação e inspeção. Incluímos agentes prontos para uso para pesquisa aprofundada e pesquisa científica, e avaliamos o AgentSPEX em 7 *benchmarks*. Por fim, demonstramos por meio de um estudo de usuário que o AgentSPEX oferece um paradigma de criação de fluxo de trabalho mais interpretável e acessível do que uma estrutura de agente popular existente.

English

Language-model agent systems commonly rely on reactive prompting, in which a single instruction guides the model through an open-ended sequence of reasoning and tool-use steps, leaving control flow and intermediate state implicit and making agent behavior potentially difficult to control. Orchestration frameworks such as LangGraph, DSPy, and CrewAI impose greater structure through explicit workflow definitions, but tightly couple workflow logic with Python, making agents difficult to maintain and modify. In this paper, we introduce AgentSPEX, an Agent SPecification and EXecution Language for specifying LLM-agent workflows with explicit control flow and modular structure, along with a customizable agent harness. AgentSPEX supports typed steps, branching and loops, parallel execution, reusable submodules, and explicit state management, and these workflows execute within an agent harness that provides tool access, a sandboxed virtual environment, and support for checkpointing, verification, and logging. Furthermore, we provide a visual editor with synchronized graph and workflow views for authoring and inspection. We include ready-to-use agents for deep research and scientific research, and we evaluate AgentSPEX on 7 benchmarks. Finally, we show through a user study that AgentSPEX provides a more interpretable and accessible workflow-authoring paradigm than a popular existing agent framework.

AgentSPEX: Uma Linguagem de Especificação e Execução de Agentes

AgentSPEX: An Agent SPecification and EXecution Language

Resumo

Support