SWE-Debate: Debate Competitivo Multiagente para la Resolución de Problemas de Software
SWE-Debate: Competitive Multi-Agent Debate for Software Issue Resolution
July 31, 2025
Autores: Han Li, Yuling Shi, Shaoxin Lin, Xiaodong Gu, Heng Lian, Xin Wang, Yantao Jia, Tao Huang, Qianxiang Wang
cs.AI
Resumen
La resolución de problemas ha experimentado un progreso notable gracias a las avanzadas capacidades de razonamiento de los modelos de lenguaje de gran escala (LLMs). Recientemente, los marcos basados en agentes, como SWE-agent, han impulsado aún más este progreso al permitir que agentes autónomos que utilizan herramientas aborden tareas complejas de ingeniería de software. Si bien los enfoques existentes de resolución de problemas basados en agentes se centran principalmente en exploraciones independientes de los agentes, estos a menudo se estancan en soluciones locales y no logran identificar patrones de problemas que abarcan diferentes partes del código base. Para abordar esta limitación, proponemos SWE-Debate, un marco competitivo de debate multiagente que fomenta diversos caminos de razonamiento y logra una localización de problemas más consolidada. SWE-Debate primero crea múltiples trazas de propagación de fallos como propuestas de localización al recorrer un gráfico de dependencias del código. Luego, organiza un debate de tres rondas entre agentes especializados, cada uno representando perspectivas de razonamiento distintas a lo largo de la traza de propagación del fallo. Esta competencia estructurada permite que los agentes colaboren para converger en un plan de solución consolidado. Finalmente, este plan consolidado se integra en un agente de modificación de código basado en MCTS para la generación de parches. Los experimentos en el benchmark SWE-bench muestran que SWE-Debate alcanza nuevos resultados de vanguardia en marcos de agentes de código abierto y supera ampliamente a los enfoques de referencia.
English
Issue resolution has made remarkable progress thanks to the advanced
reasoning capabilities of large language models (LLMs). Recently, agent-based
frameworks such as SWE-agent have further advanced this progress by enabling
autonomous, tool-using agents to tackle complex software engineering tasks.
While existing agent-based issue resolution approaches are primarily based on
agents' independent explorations, they often get stuck in local solutions and
fail to identify issue patterns that span across different parts of the
codebase. To address this limitation, we propose SWE-Debate, a competitive
multi-agent debate framework that encourages diverse reasoning paths and
achieves more consolidated issue localization. SWE-Debate first creates
multiple fault propagation traces as localization proposals by traversing a
code dependency graph. Then, it organizes a three-round debate among
specialized agents, each embodying distinct reasoning perspectives along the
fault propagation trace. This structured competition enables agents to
collaboratively converge on a consolidated fix plan. Finally, this consolidated
fix plan is integrated into an MCTS-based code modification agent for patch
generation. Experiments on the SWE-bench benchmark show that SWE-Debate
achieves new state-of-the-art results in open-source agent frameworks and
outperforms baselines by a large margin.