SWE-Pruner : Élagage contextuel auto-adaptatif pour agents de programmation
SWE-Pruner: Self-Adaptive Context Pruning for Coding Agents
January 23, 2026
Auteurs: Yuhang Wang, Yuling Shi, Mo Yang, Rongrui Zhang, Shilin He, Heng Lian, Yuting Chen, Siyu Ye, Kai Cai, Xiaodong Gu
cs.AI
Résumé
Les agents LLM ont démontré des capacités remarquables en développement logiciel, mais leurs performances sont entravées par des contextes d'interaction longs, qui engendrent des coûts d'API élevés et une latence importante. Bien que diverses approches de compression de contexte comme LongLLMLingua aient émergé pour relever ce défi, elles reposent généralement sur des métriques fixes telles que le PPL, ignorant la nature spécifique à la tâche de la compréhension du code. En conséquence, elles perturbent fréquemment la structure syntaxique et logique et échouent à conserver les détails d'implémentation critiques. Dans cet article, nous proposons SWE-Pruner, un framework de compression de contexte auto-adaptatif conçu pour les agents de programmation. S'inspirant de la façon dont les programmeurs humains « parcourent sélectivement » le code source lors du développement et du débogage, SWE-Pruner effectue une compression adaptative consciente de la tâche pour les contextes longs. Étant donné la tâche courante, l'agent formule un objectif explicite (par exemple, « se concentrer sur la gestion des erreurs ») comme indice pour guider les cibles de compression. Un skimmer neuronal léger (0,6 milliard de paramètres) est entraîné pour sélectionner dynamiquement les lignes pertinentes du contexte environnant en fonction de l'objectif. Les évaluations sur quatre benchmarks et plusieurs modèles valident l'efficacité de SWE-Pruner dans divers scénarios, atteignant une réduction de 23 à 54 % des tokens sur des tâches d'agents comme SWE-Bench Verified et jusqu'à 14,84x de compression sur des tâches en un tour comme LongCodeQA avec un impact minimal sur les performances.
English
LLM agents have demonstrated remarkable capabilities in software development, but their performance is hampered by long interaction contexts, which incur high API costs and latency. While various context compression approaches such as LongLLMLingua have emerged to tackle this challenge, they typically rely on fixed metrics such as PPL, ignoring the task-specific nature of code understanding. As a result, they frequently disrupt syntactic and logical structure and fail to retain critical implementation details. In this paper, we propose SWE-Pruner, a self-adaptive context pruning framework tailored for coding agents. Drawing inspiration from how human programmers "selectively skim" source code during development and debugging, SWE-Pruner performs task-aware adaptive pruning for long contexts. Given the current task, the agent formulates an explicit goal (e.g., "focus on error handling") as a hint to guide the pruning targets. A lightweight neural skimmer (0.6B parameters) is trained to dynamically select relevant lines from the surrounding context given the goal. Evaluations across four benchmarks and multiple models validate SWE-Pruner's effectiveness in various scenarios, achieving 23-54% token reduction on agent tasks like SWE-Bench Verified and up to 14.84x compression on single-turn tasks like LongCodeQA with minimal performance impact.