SWE-Debate: Wettbewerbsorientierte Multi-Agenten-Debatte zur Lösung von Softwareproblemen

papers.abstract

Die Problemlösung hat dank der fortgeschrittenen Denkfähigkeiten großer Sprachmodelle (LLMs) bemerkenswerte Fortschritte gemacht. Kürzlich haben agentenbasierte Frameworks wie SWE-agent diesen Fortschritt weiter vorangetrieben, indem sie autonome, werkzeugnutzende Agenten ermöglichten, um komplexe Softwareentwicklungsaufgaben zu bewältigen. Während bestehende agentenbasierte Ansätze zur Problemlösung hauptsächlich auf unabhängigen Erkundungen der Agenten basieren, bleiben sie oft in lokalen Lösungen stecken und scheitern daran, Problemstellungen zu erkennen, die sich über verschiedene Teile der Codebasis erstrecken. Um diese Einschränkung zu überwinden, schlagen wir SWE-Debate vor, ein kompetitives Multi-Agenten-Debatten-Framework, das vielfältige Denkpfade fördert und eine konsolidierte Problemlokalisierung erreicht. SWE-Debate erstellt zunächst mehrere Fehlerausbreitungspfade als Lokalisierungsvorschläge, indem es einen Code-Abhängigkeitsgraphen durchläuft. Anschließend organisiert es eine dreiründige Debatte unter spezialisierten Agenten, die jeweils unterschiedliche Denkperspektiven entlang des Fehlerausbreitungspfades verkörpern. Dieser strukturierte Wettbewerb ermöglicht es den Agenten, gemeinsam auf einen konsolidierten Lösungsplan hinzuarbeiten. Schließlich wird dieser konsolidierte Lösungsplan in einen MCTS-basierten Code-Modifikations-Agenten integriert, um Patches zu generieren. Experimente auf dem SWE-bench-Benchmark zeigen, dass SWE-Debate neue state-of-the-art-Ergebnisse in Open-Source-Agenten-Frameworks erzielt und die Baselines deutlich übertrifft.

English

Issue resolution has made remarkable progress thanks to the advanced reasoning capabilities of large language models (LLMs). Recently, agent-based frameworks such as SWE-agent have further advanced this progress by enabling autonomous, tool-using agents to tackle complex software engineering tasks. While existing agent-based issue resolution approaches are primarily based on agents' independent explorations, they often get stuck in local solutions and fail to identify issue patterns that span across different parts of the codebase. To address this limitation, we propose SWE-Debate, a competitive multi-agent debate framework that encourages diverse reasoning paths and achieves more consolidated issue localization. SWE-Debate first creates multiple fault propagation traces as localization proposals by traversing a code dependency graph. Then, it organizes a three-round debate among specialized agents, each embodying distinct reasoning perspectives along the fault propagation trace. This structured competition enables agents to collaboratively converge on a consolidated fix plan. Finally, this consolidated fix plan is integrated into an MCTS-based code modification agent for patch generation. Experiments on the SWE-bench benchmark show that SWE-Debate achieves new state-of-the-art results in open-source agent frameworks and outperforms baselines by a large margin.

SWE-Debate: Wettbewerbsorientierte Multi-Agenten-Debatte zur Lösung von Softwareproblemen

SWE-Debate: Competitive Multi-Agent Debate for Software Issue Resolution

papers.abstract

Support