Socratic-SWE: Agentes de Codificação Auto-Evolutivos via Habilidades de Agente Derivadas de Rastreamentos

Resumo

Agentes de engenharia de software orientados por LLM tornaram-se um campo de prova central para a capacidade de modelos de linguagem no mundo real, mas seu treinamento ainda é limitado pela disponibilidade de tarefas de SWE de alta qualidade. Métodos existentes de dados sintéticos tipicamente criam tarefas por meio de procedimentos fixos de mutação ou injeção de bugs, fazendo com que as distribuições resultantes sejam em grande parte independentes das fraquezas do próprio agente e do progresso do treinamento. Apresentamos o Socratic-SWE, uma estrutura de auto-evolução em malha fechada que reutiliza os traços históricos de solução do agente como fonte de sinal de treinamento. Em vez de tratar os traços apenas como evidência para computação de recompensa, o Socratic-SWE os destila em habilidades estruturadas do agente que resumem falhas recorrentes e padrões eficazes de reparo. Essas habilidades então orientam a geração de tarefas de reparo direcionadas em repositórios reais. As tarefas candidatas são verificadas por meio de validação baseada em execução e pontuadas com uma recompensa de alinhamento de gradiente do Solver, de modo que as tarefas retidas sejam verificáveis e úteis para melhorar o Solver. O Solver atualizado produz novos traços, permitindo que o currículo de tarefas se adapte ao longo de rodadas sucessivas. Em SWE-bench Verified, SWE-bench Lite, SWE-bench Pro e Terminal-Bench 2.0, o Socratic-SWE melhora consistentemente as linhas de base auto-evolutivas sob o mesmo orçamento computacional, alcançando 50,40% no SWE-bench Verified após três iterações. Esses resultados sugerem que traços de solução podem servir como um substrato escalável para agentes de SWE auto-evolutivos.

English

LLM-driven software engineering agents have become a central testbed for real-world language-model capability, yet their training remains limited by the availability of high-quality SWE tasks. Existing synthetic data methods typically create tasks through fixed mutation or bug-injection procedures, making the resulting distributions largely independent of the agent's own weaknesses and training progress. We introduce Socratic-SWE, a closed-loop self-evolution framework that reuses the agent's historical solving traces as a source of training signal. Rather than treating traces only as evidence for reward computation, Socratic-SWE distills them into structured agent skills that summarize recurring failures and effective repair patterns. These skills then guide the generation of targeted repair tasks in real repositories. Candidate tasks are checked through execution-based validation and scored with a solver-gradient alignment reward, so that the retained tasks are both verifiable and useful for improving the Solver. The updated Solver produces new traces, enabling the task curriculum to adapt over successive rounds. Across SWE-bench Verified, SWE-bench Lite, SWE-bench Pro, and Terminal-Bench 2.0, Socratic-SWE consistently improves over self-evolving baselines under the same compute budget, reaching 50.40% on SWE-bench Verified after three iterations. These results suggest that solving traces can serve as a scalable substrate for self-evolving SWE agents.