ChatPaper.aiChatPaper

SWE-AGILE: 動的推論コンテキストを効率的に管理するためのソフトウェアエージェントフレームワーク

SWE-AGILE: A Software Agent Framework for Efficiently Managing Dynamic Reasoning Context

April 13, 2026
著者: Shuquan Lian, Juncheng Liu, Yazhe Chen, Yuhong Chen, Hui Li
cs.AI

要旨

自律的なソフトウェア工学(SWE)における従来の代表的なReActスタイルのアプローチは、深い分析と複雑なエッジケースの処理に必要な明示的なSystem-2推論を一般に欠いている。近年の推論モデルは拡張された連鎖思考(CoT)の可能性を示すが、これをマルチターンから成るSWEタスクに適用することは根本的なジレンマを生む。すなわち、完全な推論履歴を保持すればコンテキストの爆発的増大と「Lost-in-the-Middle」現象による性能劣化を招き、一方でそれを破棄すればエージェントは各ステップで冗長な再推論を強制されることになる。これらの課題に対処するため、我々は推論の深さ、効率性、コンテキスト制約の間の隔たりを埋めることを目的とした、新しいソフトウェアエージェントフレームワークであるSWE-AGILEを提案する。SWE-AGILEは動的推論コンテキスト戦略を導入し、冗長な再分析を防ぐための即時の連続性を確保する詳細な推論の「スライディングウィンドウ」を維持すると同時に、過去の推論内容を簡潔な推論要約(Reasoning Digests)に圧縮する。実験により、SWE-AGILEは、わずか2.2kの軌跡と896のタスクを用いて、SWE-Bench-Verifiedにおいて7B-8Bモデルの新たな標準を確立した。コードはhttps://github.com/KDEGroup/SWE-AGILE で公開されている。
English
Prior representative ReAct-style approaches in autonomous Software Engineering (SWE) typically lack the explicit System-2 reasoning required for deep analysis and handling complex edge cases. While recent reasoning models demonstrate the potential of extended Chain-of-Thought (CoT), applying them to the multi-turn SWE task creates a fundamental dilemma: retaining full reasoning history leads to context explosion and ``Lost-in-the-Middle'' degradation, while discarding it would force the agent to redundantly re-reason at every step. To address these challenges, we propose SWE-AGILE, a novel software agent framework designed to bridge the gap between reasoning depth, efficiency, and context constraints. SWE-AGILE introduces a Dynamic Reasoning Context strategy, maintaining a ``sliding window'' of detailed reasoning for immediate continuity to prevent redundant re-analyzing, while compressing historical reasoning content into concise Reasoning Digests. Empirically, SWE-AGILE sets a new standard for 7B-8B models on SWE-Bench-Verified using only 2.2k trajectories and 896 tasks. Code is available at https://github.com/KDEGroup/SWE-AGILE.
PDF31April 15, 2026