SWE-Debate: Wettbewerbsorientierte Multi-Agenten-Debatte zur Lösung von Softwareproblemen
SWE-Debate: Competitive Multi-Agent Debate for Software Issue Resolution
July 31, 2025
papers.authors: Han Li, Yuling Shi, Shaoxin Lin, Xiaodong Gu, Heng Lian, Xin Wang, Yantao Jia, Tao Huang, Qianxiang Wang
cs.AI
papers.abstract
Die Problemlösung hat dank der fortgeschrittenen Denkfähigkeiten großer Sprachmodelle (LLMs) bemerkenswerte Fortschritte gemacht. Kürzlich haben agentenbasierte Frameworks wie SWE-agent diesen Fortschritt weiter vorangetrieben, indem sie autonome, werkzeugnutzende Agenten ermöglichten, um komplexe Softwareentwicklungsaufgaben zu bewältigen. Während bestehende agentenbasierte Ansätze zur Problemlösung hauptsächlich auf unabhängigen Erkundungen der Agenten basieren, bleiben sie oft in lokalen Lösungen stecken und scheitern daran, Problemstellungen zu erkennen, die sich über verschiedene Teile der Codebasis erstrecken. Um diese Einschränkung zu überwinden, schlagen wir SWE-Debate vor, ein kompetitives Multi-Agenten-Debatten-Framework, das vielfältige Denkpfade fördert und eine konsolidierte Problemlokalisierung erreicht. SWE-Debate erstellt zunächst mehrere Fehlerausbreitungspfade als Lokalisierungsvorschläge, indem es einen Code-Abhängigkeitsgraphen durchläuft. Anschließend organisiert es eine dreiründige Debatte unter spezialisierten Agenten, die jeweils unterschiedliche Denkperspektiven entlang des Fehlerausbreitungspfades verkörpern. Dieser strukturierte Wettbewerb ermöglicht es den Agenten, gemeinsam auf einen konsolidierten Lösungsplan hinzuarbeiten. Schließlich wird dieser konsolidierte Lösungsplan in einen MCTS-basierten Code-Modifikations-Agenten integriert, um Patches zu generieren. Experimente auf dem SWE-bench-Benchmark zeigen, dass SWE-Debate neue state-of-the-art-Ergebnisse in Open-Source-Agenten-Frameworks erzielt und die Baselines deutlich übertrifft.
English
Issue resolution has made remarkable progress thanks to the advanced
reasoning capabilities of large language models (LLMs). Recently, agent-based
frameworks such as SWE-agent have further advanced this progress by enabling
autonomous, tool-using agents to tackle complex software engineering tasks.
While existing agent-based issue resolution approaches are primarily based on
agents' independent explorations, they often get stuck in local solutions and
fail to identify issue patterns that span across different parts of the
codebase. To address this limitation, we propose SWE-Debate, a competitive
multi-agent debate framework that encourages diverse reasoning paths and
achieves more consolidated issue localization. SWE-Debate first creates
multiple fault propagation traces as localization proposals by traversing a
code dependency graph. Then, it organizes a three-round debate among
specialized agents, each embodying distinct reasoning perspectives along the
fault propagation trace. This structured competition enables agents to
collaboratively converge on a consolidated fix plan. Finally, this consolidated
fix plan is integrated into an MCTS-based code modification agent for patch
generation. Experiments on the SWE-bench benchmark show that SWE-Debate
achieves new state-of-the-art results in open-source agent frameworks and
outperforms baselines by a large margin.