SWE-Pruner: Potatura Contestuale Auto-Adattiva per Agenti di Programmazione
SWE-Pruner: Self-Adaptive Context Pruning for Coding Agents
January 23, 2026
Autori: Yuhang Wang, Yuling Shi, Mo Yang, Rongrui Zhang, Shilin He, Heng Lian, Yuting Chen, Siyu Ye, Kai Cai, Xiaodong Gu
cs.AI
Abstract
Gli agenti LLM hanno dimostrato notevoli capacità nello sviluppo software, ma le loro prestazioni sono ostacolate da contesti di interazione lunghi, che comportano elevati costi API e latenza. Sebbene siano emersi vari approcci di compressione del contesto come LongLLMLingua per affrontare questa sfida, questi si basano tipicamente su metriche fisse come il PPL, ignorando la natura specifica del compito nella comprensione del codice. Di conseguenza, spesso alterano la struttura sintattica e logica e non riescono a conservare i dettagli implementativi critici. In questo articolo, proponiamo SWE-Pruner, un framework di potatura del contesto auto-adattivo progettato specificamente per agenti di programmazione. Traendo ispirazione dal modo in cui i programmatori umani "sfogliano selettivamente" il codice sorgente durante lo sviluppo e il debugging, SWE-Pruner esegue una potatura adattiva consapevole del compito per contesti lunghi. Dato il compito corrente, l'agente formula un obiettivo esplicito (ad esempio, "concentrarsi sulla gestione degli errori") come suggerimento per guidare i target di potatura. Uno skimmer neurale leggero (0,6 miliardi di parametri) viene addestrato per selezionare dinamicamente le righe rilevanti dal contesto circostante in base all'obiettivo. Le valutazioni su quattro benchmark e modelli multipli convalidano l'efficacia di SWE-Pruner in vari scenari, raggiungendo una riduzione del 23-54% dei token su compiti di agente come SWE-Bench Verified e fino a 14,84x di compressione su compiti a turno singolo come LongCodeQA con un impatto minimo sulle prestazioni.
English
LLM agents have demonstrated remarkable capabilities in software development, but their performance is hampered by long interaction contexts, which incur high API costs and latency. While various context compression approaches such as LongLLMLingua have emerged to tackle this challenge, they typically rely on fixed metrics such as PPL, ignoring the task-specific nature of code understanding. As a result, they frequently disrupt syntactic and logical structure and fail to retain critical implementation details. In this paper, we propose SWE-Pruner, a self-adaptive context pruning framework tailored for coding agents. Drawing inspiration from how human programmers "selectively skim" source code during development and debugging, SWE-Pruner performs task-aware adaptive pruning for long contexts. Given the current task, the agent formulates an explicit goal (e.g., "focus on error handling") as a hint to guide the pruning targets. A lightweight neural skimmer (0.6B parameters) is trained to dynamically select relevant lines from the surrounding context given the goal. Evaluations across four benchmarks and multiple models validate SWE-Pruner's effectiveness in various scenarios, achieving 23-54% token reduction on agent tasks like SWE-Bench Verified and up to 14.84x compression on single-turn tasks like LongCodeQA with minimal performance impact.