ChatPaper.aiChatPaper

Stratégies efficaces pour les agents d'ingénierie logicielle asynchrones

Effective Strategies for Asynchronous Software Engineering Agents

March 23, 2026
Auteurs: Jiayi Geng, Graham Neubig
cs.AI

Résumé

Les agents IA sont devenus de plus en plus performants pour des tâches isolées de génie logiciel, comme la résolution d'incidents sur GitHub. Cependant, les tâches à long horizon impliquant de multiples sous-tâches interdépendantes restent problématiques, tant en termes de précision que d'achèvement dans les délais. Une approche naturelle pour résoudre ces tâches complexes rapidement est la collaboration asynchrone multi-agents, où plusieurs agents travaillent simultanément sur différentes parties de la tâche. Mais l'application efficace des systèmes multi-agents s'est avérée étonnamment difficile : les modifications concurrentes par plusieurs agents interfèrent entre elles, les dépendances sont difficiles à synchroniser et la combinaison des progrès partiels en un tout cohérent est complexe. D'un autre côté, les développeurs humains s'appuient depuis longtemps sur une infrastructure de collaboration mature pour gérer ces défis dans les grands projets logiciels. Inspirés par ces primitives de collaboration, nous présentons la Délégation Isolée Asynchrone Centralisée (CAID), un paradigme structuré de coordination multi-agents fondé sur trois primitives fondamentales du génie logiciel : la délégation centralisée des tâches, l'exécution asynchrone et les espaces de travail isolés. CAID construit des plans de tâches prenant en compte les dépendances via un gestionnaire central, exécute les sous-tâches concurremment dans des espaces isolés et consolide les progrès via une intégration structurée avec une vérification exécutable basée sur des tests. Lors de l'évaluation empirique, nous constatons que CAID améliore la précision de 26,7 % en valeur absolue par rapport aux approches mono-agent sur des tâches de reproduction d'articles (PaperBench) et de 14,3 % sur des tâches de développement de bibliothèques Python (Commit0). Par une analyse systématique, nous montrons que le mécanisme de branchement et fusion est central pour la collaboration multi-agents, et que les primitives logicielles comme `git worktree`, `git commit` et `git merge` permettent sa réalisation de manière fiable et exécutable.
English
AI agents have become increasingly capable at isolated software engineering (SWE) tasks such as resolving issues on Github. Yet long-horizon tasks involving multiple interdependent subtasks still pose challenges both with respect to accuracy, and with respect to timely completion. A natural approach to solving these long-horizon tasks in a timely manner is asynchronous multi-agent collaboration, where multiple agents work on different parts of the task at the same time. But effective application of multi-agent systems has proven surprisingly difficult: concurrent edits by multiple agents interfere with each other, dependencies are difficult to synchronize, and combining partial progress into a coherent whole is challenging. On the other hand, human developers have long relied on mature collaboration infrastructure to manage these challenges in large software projects. Inspired by these collaboration primitives, we introduce Centralized Asynchronous Isolated Delegation (CAID), a structured multi-agent coordination paradigm grounded in three core SWE primitives: centralized task delegation, asynchronous execution, and isolated workspaces. CAID constructs dependency-aware task plans through a central manager, executes subtasks concurrently in isolated workspaces, and consolidates progress via structured integration with executable test-based verification. In empirical evaluation, we find that CAID improves accuracy over single-agent baselines by 26.7% absolute on paper reproduction tasks (PaperBench) and 14.3% on Python library development tasks (Commit0). Through systematic analysis, we find that branch-and-merge is a central coordination mechanism for multi-agent collaboration, and that SWE primitives such as git worktree, git commit, and git merge enable it to be realized in a reliable and executable manner.
PDF41March 25, 2026