SWE-Debate: Конкурентные дебаты с участием множества агентов для решения проблем в программном обеспечении
SWE-Debate: Competitive Multi-Agent Debate for Software Issue Resolution
July 31, 2025
Авторы: Han Li, Yuling Shi, Shaoxin Lin, Xiaodong Gu, Heng Lian, Xin Wang, Yantao Jia, Tao Huang, Qianxiang Wang
cs.AI
Аннотация
Решение задач значительно продвинулось благодаря расширенным возможностям рассуждения крупных языковых моделей (LLM). Недавно агентно-ориентированные фреймворки, такие как SWE-agent, еще больше ускорили этот прогресс, позволив автономным агентам, использующим инструменты, решать сложные задачи в области разработки программного обеспечения. Хотя существующие подходы к решению задач на основе агентов в основном опираются на их независимые исследования, они часто застревают в локальных решениях и не могут выявить закономерности, охватывающие различные части кодовой базы. Чтобы устранить это ограничение, мы предлагаем SWE-Debate — конкурентный многоагентный фреймворк для дебатов, который стимулирует разнообразные пути рассуждения и обеспечивает более консолидированную локализацию проблем. SWE-Debate сначала создает несколько трасс распространения ошибок в качестве предложений по локализации, проходя по графу зависимостей кода. Затем он организует трехраундные дебаты среди специализированных агентов, каждый из которых воплощает различные точки зрения на рассуждение вдоль трассы распространения ошибки. Эта структурированная конкуренция позволяет агентам совместно сходиться к консолидированному плану исправления. Наконец, этот консолидированный план интегрируется в агента модификации кода на основе метода Монте-Карло для генерации патчей. Эксперименты на бенчмарке SWE-bench показывают, что SWE-Debate достигает новых передовых результатов среди открытых агентных фреймворков и значительно превосходит базовые подходы.
English
Issue resolution has made remarkable progress thanks to the advanced
reasoning capabilities of large language models (LLMs). Recently, agent-based
frameworks such as SWE-agent have further advanced this progress by enabling
autonomous, tool-using agents to tackle complex software engineering tasks.
While existing agent-based issue resolution approaches are primarily based on
agents' independent explorations, they often get stuck in local solutions and
fail to identify issue patterns that span across different parts of the
codebase. To address this limitation, we propose SWE-Debate, a competitive
multi-agent debate framework that encourages diverse reasoning paths and
achieves more consolidated issue localization. SWE-Debate first creates
multiple fault propagation traces as localization proposals by traversing a
code dependency graph. Then, it organizes a three-round debate among
specialized agents, each embodying distinct reasoning perspectives along the
fault propagation trace. This structured competition enables agents to
collaboratively converge on a consolidated fix plan. Finally, this consolidated
fix plan is integrated into an MCTS-based code modification agent for patch
generation. Experiments on the SWE-bench benchmark show that SWE-Debate
achieves new state-of-the-art results in open-source agent frameworks and
outperforms baselines by a large margin.