RE-TRAC: Compresión de Trayectorias Recursiva para Agentes de Búsqueda Profunda
RE-TRAC: REcursive TRAjectory Compression for Deep Search Agents
February 2, 2026
Autores: Jialiang Zhu, Gongrui Zhang, Xiaolong Ma, Lin Xu, Miaosen Zhang, Ruiqi Yang, Song Wang, Kai Qiu, Zhirong Wu, Qi Dai, Ruichun Ma, Bei Liu, Yifan Yang, Chong Luo, Zhengyuan Yang, Linjie Li, Lijuan Wang, Weizhu Chen, Xin Geng, Baining Guo
cs.AI
Resumen
Los agentes de investigación profunda basados en LLM se construyen principalmente sobre el marco ReAct. Este diseño lineal dificulta la revisión de estados anteriores, la ramificación en direcciones de búsqueda alternativas o el mantenimiento de una conciencia global bajo contextos largos, lo que a menudo conduce a óptimos locales, exploración redundante y búsqueda ineficiente. Proponemos Re-TRAC, un marco agéntico que realiza una exploración transversal de trayectorias generando una representación estructurada del estado después de cada trayectoria para resumir evidencias, incertidumbres, fallos y planes futuros, y condicionando las trayectorias posteriores a esta representación de estado. Esto permite una reflexión iterativa y una planificación con información global, replanteando la investigación como un proceso progresivo. Los resultados empíricos muestran que Re-TRAC supera consistentemente a ReAct en un 15-20% en BrowseComp con LLMs de vanguardia. Para modelos más pequeños, introducimos el ajuste supervisado consciente de Re-TRAC (Re-TRAC-aware supervised fine-tuning), logrando un rendimiento de última generación en escalas comparables. Notablemente, Re-TRAC muestra una reducción monótona en las llamadas a herramientas y el uso de tokens a lo largo de las rondas, lo que indica una exploración progresivamente dirigida impulsada por la reflexión transversal de trayectorias en lugar de una búsqueda redundante.
English
LLM-based deep research agents are largely built on the ReAct framework. This linear design makes it difficult to revisit earlier states, branch into alternative search directions, or maintain global awareness under long contexts, often leading to local optima, redundant exploration, and inefficient search. We propose Re-TRAC, an agentic framework that performs cross-trajectory exploration by generating a structured state representation after each trajectory to summarize evidence, uncertainties, failures, and future plans, and conditioning subsequent trajectories on this state representation. This enables iterative reflection and globally informed planning, reframing research as a progressive process. Empirical results show that Re-TRAC consistently outperforms ReAct by 15-20% on BrowseComp with frontier LLMs. For smaller models, we introduce Re-TRAC-aware supervised fine-tuning, achieving state-of-the-art performance at comparable scales. Notably, Re-TRAC shows a monotonic reduction in tool calls and token usage across rounds, indicating progressively targeted exploration driven by cross-trajectory reflection rather than redundant search.