ChatPaper.aiChatPaper

범위: 에이전트 효과성 강화를 위한 프롬프트 진화

SCOPE: Prompt Evolution for Enhancing Agent Effectiveness

December 17, 2025
저자: Zehua Pei, Hui-Ling Zhen, Shixiong Kai, Sinno Jialin Pan, Yunhe Wang, Mingxuan Yuan, Bei Yu
cs.AI

초록

대규모 언어 모델(LLM) 에이전트는 방대하고 동적인 컨텍스트를 생성하는 환경에 점점 더 많이 배포되고 있습니다. 그러나 중요한 병목 현상은 여전히 존재합니다. 에이전트가 이러한 컨텍스트에 접근할 수 있지만, 정적인 프롬프트는 이를 효과적으로 관리할 수 있는 메커니즘이 부족하여 반복적인 수정(Corrective) 및 향상(Enhancement) 실패로 이어집니다. 이러한 역량 격차를 해결하기 위해 우리는 SCOPE(Self-evolving Context Optimization via Prompt Evolution)를 소개합니다. SCOPE는 컨텍스트 관리를 온라인 최적화 문제로 규정하고, 실행 흔적(execution traces)에서 지침을 종합하여 에이전트의 프롬프트를 자동으로 발전시킵니다. 우리는 전술적 특수성(즉각적인 오류 해결)과 전략적 일반성(장기적 원칙 발전)의 균형을 맞추는 이중 스트림(Dual-Stream) 메커니즘을 제안합니다. 더 나아가, 전략 적용 범위를 극대화하여 에이전트가 주어진 작업에 대해 올바른 전략을 보유할 가능성을 높이는 관점 주도 탐색(Perspective-Driven Exploration)을 도입합니다. HLE 벤치마크에서의 실험 결과, SCOPE는 인간의 개입 없이 작업 성공률을 14.23%에서 38.64%로 향상시키는 것으로 나타났습니다. 우리는 코드를 https://github.com/JarvisPei/SCOPE 에 공개했습니다.
English
Large Language Model (LLM) agents are increasingly deployed in environments that generate massive, dynamic contexts. However, a critical bottleneck remains: while agents have access to this context, their static prompts lack the mechanisms to manage it effectively, leading to recurring Corrective and Enhancement failures. To address this capability gap, we introduce SCOPE (Self-evolving Context Optimization via Prompt Evolution). SCOPE frames context management as an online optimization problem, synthesizing guidelines from execution traces to automatically evolve the agent's prompt. We propose a Dual-Stream mechanism that balances tactical specificity (resolving immediate errors) with strategic generality (evolving long-term principles). Furthermore, we introduce Perspective-Driven Exploration to maximize strategy coverage, increasing the likelihood that the agent has the correct strategy for any given task. Experiments on the HLE benchmark show that SCOPE improves task success rates from 14.23\% to 38.64\% without human intervention. We make our code publicly available at https://github.com/JarvisPei/SCOPE.
PDF52December 19, 2025