SWE-Debate: Competitief Multi-Agent Debat voor Softwareprobleemoplossing
SWE-Debate: Competitive Multi-Agent Debate for Software Issue Resolution
July 31, 2025
Auteurs: Han Li, Yuling Shi, Shaoxin Lin, Xiaodong Gu, Heng Lian, Xin Wang, Yantao Jia, Tao Huang, Qianxiang Wang
cs.AI
Samenvatting
Probleemoplossing heeft opmerkelijke vooruitgang geboekt dankzij de geavanceerde redeneervaardigheden van grote taalmodellen (LLMs). Recentelijk hebben agent-gebaseerde frameworks zoals SWE-agent deze vooruitgang verder bevorderd door autonome, tool-gebruikende agents in staat te stellen complexe software-engineeringtaken aan te pakken. Hoewel bestaande agent-gebaseerde benaderingen voor probleemoplossing voornamelijk gebaseerd zijn op onafhankelijke verkenningen door agents, komen ze vaak vast te zitten in lokale oplossingen en slagen ze er niet in probleempatronen te identificeren die verschillende delen van de codebase overspannen. Om deze beperking aan te pakken, stellen we SWE-Debate voor, een competitief multi-agent debatframework dat diverse redeneerpaden aanmoedigt en een meer geconsolideerde lokalisatie van problemen bereikt. SWE-Debate creëert eerst meerdere foutpropagatiesporen als lokalisatievoorstellen door een code-afhankelijkheidsgrafiek te doorlopen. Vervolgens organiseert het een drie-rondes debat onder gespecialiseerde agents, die elk verschillende redeneerperspectieven belichamen langs het foutpropagatiespoor. Deze gestructureerde competitie stelt agents in staat om samen te werken en te convergeren naar een geconsolideerd reparatieplan. Ten slotte wordt dit geconsolideerde reparatieplan geïntegreerd in een MCTS-gebaseerde codewijzigingsagent voor het genereren van patches. Experimenten op de SWE-bench benchmark laten zien dat SWE-Debate nieuwe state-of-the-art resultaten behaalt in open-source agentframeworks en de baseline-methoden met een grote marge overtreft.
English
Issue resolution has made remarkable progress thanks to the advanced
reasoning capabilities of large language models (LLMs). Recently, agent-based
frameworks such as SWE-agent have further advanced this progress by enabling
autonomous, tool-using agents to tackle complex software engineering tasks.
While existing agent-based issue resolution approaches are primarily based on
agents' independent explorations, they often get stuck in local solutions and
fail to identify issue patterns that span across different parts of the
codebase. To address this limitation, we propose SWE-Debate, a competitive
multi-agent debate framework that encourages diverse reasoning paths and
achieves more consolidated issue localization. SWE-Debate first creates
multiple fault propagation traces as localization proposals by traversing a
code dependency graph. Then, it organizes a three-round debate among
specialized agents, each embodying distinct reasoning perspectives along the
fault propagation trace. This structured competition enables agents to
collaboratively converge on a consolidated fix plan. Finally, this consolidated
fix plan is integrated into an MCTS-based code modification agent for patch
generation. Experiments on the SWE-bench benchmark show that SWE-Debate
achieves new state-of-the-art results in open-source agent frameworks and
outperforms baselines by a large margin.