ChatPaper.aiChatPaper

RE-TRAC : Compression RÉcursive de TRAjectoire pour Agents de Recherche Profonde

RE-TRAC: REcursive TRAjectory Compression for Deep Search Agents

February 2, 2026
papers.authors: Jialiang Zhu, Gongrui Zhang, Xiaolong Ma, Lin Xu, Miaosen Zhang, Ruiqi Yang, Song Wang, Kai Qiu, Zhirong Wu, Qi Dai, Ruichun Ma, Bei Liu, Yifan Yang, Chong Luo, Zhengyuan Yang, Linjie Li, Lijuan Wang, Weizhu Chen, Xin Geng, Baining Guo
cs.AI

papers.abstract

Les agents de recherche approfondie basés sur LLM sont largement construits sur le cadre ReAct. Cette conception linéaire rend difficile la révision d'états antérieurs, l'exploration de directions de recherche alternatives ou le maintien d'une conscience globale dans des contextes longs, conduisant souvent à des optima locaux, des explorations redondantes et des recherches inefficaces. Nous proposons Re-TRAC, un cadre agentiel qui effectue une exploration transversale des trajectoires en générant une représentation structurée de l'état après chaque trajectoire pour résumer les preuves, les incertitudes, les échecs et les plans futurs, et en conditionnant les trajectoires suivantes sur cette représentation d'état. Cela permet une réflexion itérative et une planification globalement informée, redéfinissant la recherche comme un processus progressif. Les résultats empiriques montrent que Re-TRAC surpasse systématiquement ReAct de 15 à 20 % sur BrowseComp avec des LLM de pointe. Pour les modèles plus petits, nous introduisons un fine-tuning supervisé conscient de Re-TRAC, atteignant des performances de pointe à des échelles comparables. Notamment, Re-TRAC montre une réduction monotone des appels d'outils et de l'utilisation de tokens sur plusieurs rounds, indiquant une exploration progressivement ciblée pilotée par la réflexion transversale plutôt que par une recherche redondante.
English
LLM-based deep research agents are largely built on the ReAct framework. This linear design makes it difficult to revisit earlier states, branch into alternative search directions, or maintain global awareness under long contexts, often leading to local optima, redundant exploration, and inefficient search. We propose Re-TRAC, an agentic framework that performs cross-trajectory exploration by generating a structured state representation after each trajectory to summarize evidence, uncertainties, failures, and future plans, and conditioning subsequent trajectories on this state representation. This enables iterative reflection and globally informed planning, reframing research as a progressive process. Empirical results show that Re-TRAC consistently outperforms ReAct by 15-20% on BrowseComp with frontier LLMs. For smaller models, we introduce Re-TRAC-aware supervised fine-tuning, achieving state-of-the-art performance at comparable scales. Notably, Re-TRAC shows a monotonic reduction in tool calls and token usage across rounds, indicating progressively targeted exploration driven by cross-trajectory reflection rather than redundant search.
PDF161February 7, 2026