PORTÉE : Évolution des Prompts pour Améliorer l'Efficacité des Agents
SCOPE: Prompt Evolution for Enhancing Agent Effectiveness
December 17, 2025
papers.authors: Zehua Pei, Hui-Ling Zhen, Shixiong Kai, Sinno Jialin Pan, Yunhe Wang, Mingxuan Yuan, Bei Yu
cs.AI
papers.abstract
Les agents de modèles de langage de grande taille (LLM) sont de plus en plus déployés dans des environnements générant des contextes massifs et dynamiques. Cependant, un goulot d'étranglement critique persiste : bien que les agents aient accès à ce contexte, leurs prompts statiques manquent des mécanismes nécessaires pour le gérer efficacement, entraînant des échecs récurrents de Correction et d'Amélioration. Pour combler cette lacune capacitaire, nous présentons SCOPE (Optimisation Autonome du Contexte par Évolution des Prompts). SCOPE formule la gestion du contexte comme un problème d'optimisation en ligne, synthétisant des directives à partir des traces d'exécution pour faire évoluer automatiquement le prompt de l'agent. Nous proposons un mécanisme à Double Flux qui équilibre la spécificité tactique (résoudre les erreurs immédiates) avec la généralité stratégique (faire évoluer les principes à long terme). De plus, nous introduisons l'Exploration Guidée par la Perspective pour maximiser la couverture stratégique, augmentant la probabilité que l'agent dispose de la bonne stratégie pour toute tâche donnée. Les expériences sur le benchmark HLE montrent que SCOPE améliore les taux de réussite des tâches de 14,23 % à 38,64 % sans intervention humaine. Nous rendons notre code public à l'adresse https://github.com/JarvisPei/SCOPE.
English
Large Language Model (LLM) agents are increasingly deployed in environments that generate massive, dynamic contexts. However, a critical bottleneck remains: while agents have access to this context, their static prompts lack the mechanisms to manage it effectively, leading to recurring Corrective and Enhancement failures. To address this capability gap, we introduce SCOPE (Self-evolving Context Optimization via Prompt Evolution). SCOPE frames context management as an online optimization problem, synthesizing guidelines from execution traces to automatically evolve the agent's prompt. We propose a Dual-Stream mechanism that balances tactical specificity (resolving immediate errors) with strategic generality (evolving long-term principles). Furthermore, we introduce Perspective-Driven Exploration to maximize strategy coverage, increasing the likelihood that the agent has the correct strategy for any given task. Experiments on the HLE benchmark show that SCOPE improves task success rates from 14.23\% to 38.64\% without human intervention. We make our code publicly available at https://github.com/JarvisPei/SCOPE.