ChatPaper.aiChatPaper

Estrategias Eficaces para Agentes de Ingeniería de Software Asíncronos

Effective Strategies for Asynchronous Software Engineering Agents

March 23, 2026
Autores: Jiayi Geng, Graham Neubig
cs.AI

Resumen

Los agentes de IA han demostrado una capacidad creciente para realizar tareas aisladas de ingeniería de software, como resolver incidencias en GitHub. Sin embargo, las tareas de horizonte largo que implican múltiples subtareas interdependientes siguen presentando desafíos tanto en precisión como en cumplimiento de plazos. Un enfoque natural para resolver estas tareas de manera oportuna es la colaboración asíncrona multiagente, donde varios agentes trabajan simultáneamente en diferentes partes de la tarea. No obstante, la aplicación efectiva de sistemas multiagente ha resultado sorprendentemente difícil: las ediciones concurrentes de múltiples agentes interfieren entre sí, las dependencias son difíciles de sincronizar y consolidar el progreso parcial en un conjunto coherente representa un reto. Por otro lado, los desarrolladores humanos han dependido durante mucho tiempo de infraestructuras de colaboración maduras para gestionar estos desafíos en grandes proyectos de software. Inspirados por estas primitivas de colaboración, presentamos la Delegación Aislada Asíncrona Centralizada (CAID), un paradigma estructurado de coordinación multiagente basado en tres primitivas fundamentales de ingeniería de software: delegación centralizada de tareas, ejecución asíncrona y espacios de trabajo aislados. CAID construye planes de tareas conscientes de las dependencias mediante un gestor central, ejecuta subtareas concurrentemente en espacios aislados y consolida el progreso mediante una integración estructurada con verificación ejecutable basada en pruebas. En evaluaciones empíricas, encontramos que CAID mejora la precisión en un 26.7% absoluto respecto a líneas base de agente único en tareas de reproducción de artículos (PaperBench) y un 14.3% en tareas de desarrollo de bibliotecas Python (Commit0). Mediante análisis sistemático, determinamos que la ramificación y fusión (branch-and-merge) constituye un mecanismo central de coordinación para la colaboración multiagente, y que primitivas de ingeniería de software como git worktree, git commit y git merge permiten implementarlo de manera confiable y ejecutable.
English
AI agents have become increasingly capable at isolated software engineering (SWE) tasks such as resolving issues on Github. Yet long-horizon tasks involving multiple interdependent subtasks still pose challenges both with respect to accuracy, and with respect to timely completion. A natural approach to solving these long-horizon tasks in a timely manner is asynchronous multi-agent collaboration, where multiple agents work on different parts of the task at the same time. But effective application of multi-agent systems has proven surprisingly difficult: concurrent edits by multiple agents interfere with each other, dependencies are difficult to synchronize, and combining partial progress into a coherent whole is challenging. On the other hand, human developers have long relied on mature collaboration infrastructure to manage these challenges in large software projects. Inspired by these collaboration primitives, we introduce Centralized Asynchronous Isolated Delegation (CAID), a structured multi-agent coordination paradigm grounded in three core SWE primitives: centralized task delegation, asynchronous execution, and isolated workspaces. CAID constructs dependency-aware task plans through a central manager, executes subtasks concurrently in isolated workspaces, and consolidates progress via structured integration with executable test-based verification. In empirical evaluation, we find that CAID improves accuracy over single-agent baselines by 26.7% absolute on paper reproduction tasks (PaperBench) and 14.3% on Python library development tasks (Commit0). Through systematic analysis, we find that branch-and-merge is a central coordination mechanism for multi-agent collaboration, and that SWE primitives such as git worktree, git commit, and git merge enable it to be realized in a reliable and executable manner.
PDF41March 25, 2026