SERA: Agentes de Repositório Eficientes com Verificação Suave

Resumo

Os agentes de codificação de pesos abertos deveriam ter uma vantagem fundamental sobre os sistemas de código fechado: eles podem ser especializados para bases de código privadas, codificando informações específicas do repositório diretamente em seus pesos. No entanto, o custo e a complexidade do treinamento mantiveram essa vantagem no campo teórico. Nós demonstramos que agora isso é prático. Apresentamos os Soft-Verified Efficient Repository Agents (SERA), um método eficiente para treinar agentes de codificação que permite a criação rápida e barata de agentes especializados em bases de código privadas. Usando apenas ajuste fino supervisionado (SFT), o SERA alcança resultados de ponta entre modelos totalmente de código aberto (dados, método e código abertos) enquanto iguala o desempenho de modelos de pesos abertos de fronteira, como o Devstral-Small-2. Criar modelos SERA é 26 vezes mais barato do que o aprendizado por reforço e 57 vezes mais barato do que os métodos anteriores com dados sintéticos para atingir desempenho equivalente. Nosso método, a Geração Suavemente Verificada (SVG), gera milhares de trajetórias a partir de um único repositório de código. Combinada com a eficiência de custos, isso permite a especialização para bases de código privadas. Além da especialização de repositórios, aplicamos o SVG a um corpus maior de bases de código, gerando mais de 200.000 trajetórias sintéticas. Usamos este conjunto de dados para fornecer uma análise detalhada das leis de escala, ablações e fatores de confusão para o treinamento de agentes de codificação. No geral, acreditamos que nosso trabalho acelerará muito a pesquisa sobre agentes de codificação abertos e demonstrará a vantagem dos modelos de código aberto que podem se especializar em bases de código privadas. Lançamos o SERA como o primeiro modelo da série Open Coding Agents da AI2, juntamente com todo o nosso código, dados e integração com o Claude Code para apoiar a comunidade de pesquisa.

English

Open-weight coding agents should hold a fundamental advantage over closed-source systems: they can be specialized to private codebases, encoding repository-specific information directly in their weights. Yet the cost and complexity of training has kept this advantage theoretical. We show it is now practical. We present Soft-Verified Efficient Repository Agents (SERA), an efficient method for training coding agents that enables the rapid and cheap creation of agents specialized to private codebases. Using only supervised finetuning (SFT), SERA achieves state-of-the-art results among fully open-source (open data, method, code) models while matching the performance of frontier open-weight models like Devstral-Small-2. Creating SERA models is 26x cheaper than reinforcement learning and 57x cheaper than previous synthetic data methods to reach equivalent performance. Our method, Soft Verified Generation (SVG), generates thousands of trajectories from a single code repository. Combined with cost-efficiency, this enables specialization to private codebases. Beyond repository specialization, we apply SVG to a larger corpus of codebases, generating over 200,000 synthetic trajectories. We use this dataset to provide detailed analysis of scaling laws, ablations, and confounding factors for training coding agents. Overall, we believe our work will greatly accelerate research on open coding agents and showcase the advantage of open-source models that can specialize to private codebases. We release SERA as the first model in Ai2's Open Coding Agents series, along with all our code, data, and Claude Code integration to support the research community.