ChatPaper.aiChatPaper

SWE-Debate: Dibattito Competitivo Multi-Agente per la Risoluzione di Problemi Software

SWE-Debate: Competitive Multi-Agent Debate for Software Issue Resolution

July 31, 2025
Autori: Han Li, Yuling Shi, Shaoxin Lin, Xiaodong Gu, Heng Lian, Xin Wang, Yantao Jia, Tao Huang, Qianxiang Wang
cs.AI

Abstract

La risoluzione dei problemi ha compiuto progressi significativi grazie alle avanzate capacità di ragionamento dei grandi modelli linguistici (LLM). Recentemente, framework basati su agenti come SWE-agent hanno ulteriormente spinto questi progressi, consentendo a agenti autonomi e dotati di strumenti di affrontare complessi compiti di ingegneria del software. Sebbene gli approcci esistenti alla risoluzione dei problemi basati su agenti si fondino principalmente su esplorazioni indipendenti degli agenti, questi spesso rimangono bloccati in soluzioni locali e non riescono a identificare pattern di problemi che si estendono su diverse parti della codebase. Per affrontare questa limitazione, proponiamo SWE-Debate, un framework competitivo di dibattito multi-agente che incoraggia percorsi di ragionamento diversificati e raggiunge una localizzazione dei problemi più consolidata. SWE-Debate crea innanzitutto molteplici tracce di propagazione degli errori come proposte di localizzazione, attraversando un grafo di dipendenze del codice. Successivamente, organizza un dibattito in tre round tra agenti specializzati, ciascuno dei quali incarna prospettive di ragionamento distinte lungo la traccia di propagazione degli errori. Questa competizione strutturata consente agli agenti di convergere collaborativamente su un piano di risoluzione consolidato. Infine, questo piano di risoluzione consolidato viene integrato in un agente di modifica del codice basato su MCTS per la generazione di patch. Esperimenti condotti sul benchmark SWE-bench dimostrano che SWE-Debate raggiunge nuovi risultati all'avanguardia nei framework di agenti open-source e supera di gran lunga i baseline.
English
Issue resolution has made remarkable progress thanks to the advanced reasoning capabilities of large language models (LLMs). Recently, agent-based frameworks such as SWE-agent have further advanced this progress by enabling autonomous, tool-using agents to tackle complex software engineering tasks. While existing agent-based issue resolution approaches are primarily based on agents' independent explorations, they often get stuck in local solutions and fail to identify issue patterns that span across different parts of the codebase. To address this limitation, we propose SWE-Debate, a competitive multi-agent debate framework that encourages diverse reasoning paths and achieves more consolidated issue localization. SWE-Debate first creates multiple fault propagation traces as localization proposals by traversing a code dependency graph. Then, it organizes a three-round debate among specialized agents, each embodying distinct reasoning perspectives along the fault propagation trace. This structured competition enables agents to collaboratively converge on a consolidated fix plan. Finally, this consolidated fix plan is integrated into an MCTS-based code modification agent for patch generation. Experiments on the SWE-bench benchmark show that SWE-Debate achieves new state-of-the-art results in open-source agent frameworks and outperforms baselines by a large margin.
PDF112August 4, 2025