SWE-Debate: Debate Competitivo entre Múltiplos Agentes para Resolução de Problemas de Software
SWE-Debate: Competitive Multi-Agent Debate for Software Issue Resolution
July 31, 2025
Autores: Han Li, Yuling Shi, Shaoxin Lin, Xiaodong Gu, Heng Lian, Xin Wang, Yantao Jia, Tao Huang, Qianxiang Wang
cs.AI
Resumo
A resolução de problemas tem feito progressos notáveis graças às capacidades avançadas de raciocínio dos grandes modelos de linguagem (LLMs). Recentemente, frameworks baseados em agentes, como o SWE-agent, avançaram ainda mais esse progresso ao permitir que agentes autônomos e capazes de utilizar ferramentas enfrentem tarefas complexas de engenharia de software. Embora as abordagens existentes de resolução de problemas baseadas em agentes se baseiem principalmente em explorações independentes dos agentes, elas frequentemente ficam presas em soluções locais e falham em identificar padrões de problemas que se estendem por diferentes partes da base de código. Para superar essa limitação, propomos o SWE-Debate, um framework competitivo de debate multiagente que incentiva caminhos de raciocínio diversos e alcança uma localização de problemas mais consolidada. O SWE-Debate primeiro cria múltiplos rastros de propagação de falhas como propostas de localização, percorrendo um grafo de dependência de código. Em seguida, organiza um debate de três rodadas entre agentes especializados, cada um incorporando perspectivas de raciocínio distintas ao longo do rastro de propagação de falhas. Essa competição estruturada permite que os agentes colaborem para convergir em um plano de correção consolidado. Por fim, esse plano de correção consolidado é integrado a um agente de modificação de código baseado em MCTS para a geração de patches. Experimentos no benchmark SWE-bench mostram que o SWE-Debate alcança novos resultados state-of-the-art em frameworks de agentes de código aberto e supera as linhas de base por uma grande margem.
English
Issue resolution has made remarkable progress thanks to the advanced
reasoning capabilities of large language models (LLMs). Recently, agent-based
frameworks such as SWE-agent have further advanced this progress by enabling
autonomous, tool-using agents to tackle complex software engineering tasks.
While existing agent-based issue resolution approaches are primarily based on
agents' independent explorations, they often get stuck in local solutions and
fail to identify issue patterns that span across different parts of the
codebase. To address this limitation, we propose SWE-Debate, a competitive
multi-agent debate framework that encourages diverse reasoning paths and
achieves more consolidated issue localization. SWE-Debate first creates
multiple fault propagation traces as localization proposals by traversing a
code dependency graph. Then, it organizes a three-round debate among
specialized agents, each embodying distinct reasoning perspectives along the
fault propagation trace. This structured competition enables agents to
collaboratively converge on a consolidated fix plan. Finally, this consolidated
fix plan is integrated into an MCTS-based code modification agent for patch
generation. Experiments on the SWE-bench benchmark show that SWE-Debate
achieves new state-of-the-art results in open-source agent frameworks and
outperforms baselines by a large margin.