ChatPaper.aiChatPaper

スコープ:エージェントの有効性を高めるためのプロンプト進化

SCOPE: Prompt Evolution for Enhancing Agent Effectiveness

December 17, 2025
著者: Zehua Pei, Hui-Ling Zhen, Shixiong Kai, Sinno Jialin Pan, Yunhe Wang, Mingxuan Yuan, Bei Yu
cs.AI

要旨

大規模言語モデル(LLM)エージェントが、大規模で動的なコンテキストを生成する環境に展開される機会が増えている。しかし、重大なボトルネックが残っている:エージェントはこのコンテキストにアクセスできる一方で、その静的プロンプトにはコンテキストを効果的に管理するメカニズムが欠如しており、修正失敗や機能強化失敗が繰り返し発生している。この能力ギャップに対処するため、我々はSCOPE(プロンプト進化による自己進化的コンテキスト最適化)を提案する。SCOPEはコンテキスト管理をオンライン最適化問題として定式化し、実行トレースからガイドラインを合成してエージェントのプロンプトを自動的に進化させる。我々は、戦術的特異性(即時のエラー解決)と戦略的一般性(長期的原則の進化)のバランスを取るデュアルストリームメカニズムを提案する。さらに、戦略の適用範囲を最大化し、エージェントが任意のタスクに対して正しい戦略を持つ可能性を高めるため、視点駆動探索を導入する。HLEベンチマークによる実験では、SCOPEが人間の介入なしにタスク成功率を14.23%から38.64%に向上させることが示された。コードはhttps://github.com/JarvisPei/SCOPE で公開している。
English
Large Language Model (LLM) agents are increasingly deployed in environments that generate massive, dynamic contexts. However, a critical bottleneck remains: while agents have access to this context, their static prompts lack the mechanisms to manage it effectively, leading to recurring Corrective and Enhancement failures. To address this capability gap, we introduce SCOPE (Self-evolving Context Optimization via Prompt Evolution). SCOPE frames context management as an online optimization problem, synthesizing guidelines from execution traces to automatically evolve the agent's prompt. We propose a Dual-Stream mechanism that balances tactical specificity (resolving immediate errors) with strategic generality (evolving long-term principles). Furthermore, we introduce Perspective-Driven Exploration to maximize strategy coverage, increasing the likelihood that the agent has the correct strategy for any given task. Experiments on the HLE benchmark show that SCOPE improves task success rates from 14.23\% to 38.64\% without human intervention. We make our code publicly available at https://github.com/JarvisPei/SCOPE.
PDF52December 19, 2025