SWE-Master: ポストトレーニングによるソフトウェアエンジニアリングエージェントの可能性の解放
SWE-Master: Unleashing the Potential of Software Engineering Agents via Post-Training
February 3, 2026
著者: Huatong Song, Lisheng Huang, Shuang Sun, Jinhao Jiang, Ran Le, Daixuan Cheng, Guoxin Chen, Yiwen Hu, Zongchao Chen, Wayne Xin Zhao, Yang Song, Tao Zhang, Ji-Rong Wen
cs.AI
要旨
本技術報告では、効果的なソフトウェアエンジニアリングエージェントを構築するための、オープンソースかつ完全に再現可能な学習後フレームワークであるSWE-Masterを提案する。SWE-Masterは、教師軌道合成とデータキュレーション、長期的な教師ありファインチューニング、実実行フィードバックを用いた強化学習、推論フレームワーク設計を含む、エージェント開発パイプライン全体を体系的に探求する。初期のSWE能力が限られたオープンソースのベースモデルから出発し、SWE-Masterは体系的な最適化手法が強力な長期的SWEタスク解決能力を引き出す方法を示す。現実的なソフトウェアエンジニアリングタスクの標準ベンチマークであるSWE-bench VerifiedにおいてSWE-Masterを評価した。同一の実験設定下で、本アプローチはQwen2.5-Coder-32Bを用いて61.4%の解決率を達成し、既存のオープンソースベースラインを大幅に上回った。さらに、LLMベースの環境フィードバックを用いたテスト時スケーリングを組み込むことで、SWE-MasterはTTS@8において70.8%に達し、強力な性能ポテンシャルを示した。SWE-Masterは、ソフトウェアエンジニアリングエージェントに関する再現可能な研究を推進するための実用的で透明性の高い基盤を提供する。コードはhttps://github.com/RUCAIBox/SWE-Master で公開されている。
English
In this technical report, we present SWE-Master, an open-source and fully reproducible post-training framework for building effective software engineering agents. SWE-Master systematically explores the complete agent development pipeline, including teacher-trajectory synthesis and data curation, long-horizon SFT, RL with real execution feedback, and inference framework design. Starting from an open-source base model with limited initial SWE capability, SWE-Master demonstrates how systematical optimization method can elicit strong long-horizon SWE task solving abilities. We evaluate SWE-Master on SWE-bench Verified, a standard benchmark for realistic software engineering tasks. Under identical experimental settings, our approach achieves a resolve rate of 61.4\% with Qwen2.5-Coder-32B, substantially outperforming existing open-source baselines. By further incorporating test-time scaling~(TTS) with LLM-based environment feedback, SWE-Master reaches 70.8\% at TTS@8, demonstrating a strong performance potential. SWE-Master provides a practical and transparent foundation for advancing reproducible research on software engineering agents. The code is available at https://github.com/RUCAIBox/SWE-Master.