ChatPaper.aiChatPaper

RE-TRAC: 심층 탐색 에이전트를 위한 재귀적 궤적 압축

RE-TRAC: REcursive TRAjectory Compression for Deep Search Agents

February 2, 2026
저자: Jialiang Zhu, Gongrui Zhang, Xiaolong Ma, Lin Xu, Miaosen Zhang, Ruiqi Yang, Song Wang, Kai Qiu, Zhirong Wu, Qi Dai, Ruichun Ma, Bei Liu, Yifan Yang, Chong Luo, Zhengyuan Yang, Linjie Li, Lijuan Wang, Weizhu Chen, Xin Geng, Baining Guo
cs.AI

초록

LLM 기반 심층 연구 에이전트는 대부분 ReAct 프레임워크에 기반을 두고 있습니다. 이러한 선형 설계는 이전 상태를 재검토하거나 대체 탐색 방향으로 분기하거나 긴 맥락 하에서 전역 인식을 유지하는 것을 어렵게 만들어, 종종 지역 최적점, 중복 탐색 및 비효율적인 탐색으로 이어집니다. 우리는 각 궤적 이후 증거, 불확실성, 실패 및 향후 계획을 요약하기 위해 구조화된 상태 표현을 생성하고, 이후 궤적을 이 상태 표현에 조건화함으로써 교차 궤적 탐색을 수행하는 에이전트 프레임워크인 Re-TRAC을 제안합니다. 이를 통해 반복적 성찰과 전역적으로 정보화된 계획 수립이 가능해지며, 연구를 점진적인 과정으로 재구성합니다. 실험 결과에 따르면 Re-TRAC은 최신 LLM을 사용한 BrowseComp에서 ReAct보다 15-20% 일관적으로 우수한 성능을 보입니다. 더 작은 모델의 경우 Re-TRAC 인지 지도 미세 조정을 도입하여 유사한 규모에서 최첨단 성능을 달성했습니다. 특히 Re-TRAC은 라운드별 도구 호출 및 토큰 사용량이 단조롭게 감소하는 것을 보여주며, 이는 중복 탐색이 아닌 교차 궤적 성찰에 의해 주도되는 점진적으로 표적화된 탐색을 나타냅니다.
English
LLM-based deep research agents are largely built on the ReAct framework. This linear design makes it difficult to revisit earlier states, branch into alternative search directions, or maintain global awareness under long contexts, often leading to local optima, redundant exploration, and inefficient search. We propose Re-TRAC, an agentic framework that performs cross-trajectory exploration by generating a structured state representation after each trajectory to summarize evidence, uncertainties, failures, and future plans, and conditioning subsequent trajectories on this state representation. This enables iterative reflection and globally informed planning, reframing research as a progressive process. Empirical results show that Re-TRAC consistently outperforms ReAct by 15-20% on BrowseComp with frontier LLMs. For smaller models, we introduce Re-TRAC-aware supervised fine-tuning, achieving state-of-the-art performance at comparable scales. Notably, Re-TRAC shows a monotonic reduction in tool calls and token usage across rounds, indicating progressively targeted exploration driven by cross-trajectory reflection rather than redundant search.
PDF161February 7, 2026