Hacia Agentes Eficientes: Memoria, Aprendizaje de Herramientas y Planificación
Toward Efficient Agents: Memory, Tool learning, and Planning
January 20, 2026
Autores: Xiaofang Yang, Lijun Li, Heng Zhou, Tong Zhu, Xiaoye Qu, Yuchen Fan, Qianshan Wei, Rui Ye, Li Kang, Yiran Qin, Zhiqiang Kou, Daizong Liu, Qi Li, Ning Ding, Siheng Chen, Jing Shao
cs.AI
Resumen
En los últimos años ha aumentado el interés por extender los grandes modelos de lenguaje hacia sistemas con capacidad de agencia. Si bien la efectividad de los agentes ha seguido mejorando, la eficiencia, que es crucial para el despliegue en escenarios reales, a menudo ha sido pasada por alto. Este artículo investiga, por tanto, la eficiencia desde tres componentes centrales de los agentes: la memoria, el aprendizaje del uso de herramientas y la planificación, considerando costes como la latencia, el número de tokens, los pasos de ejecución, etc. Con el objetivo de realizar una investigación exhaustiva que aborde la eficiencia del propio sistema de agencia, revisamos un amplio abanico de enfoques recientes que difieren en su implementación pero que frecuentemente convergen en principios de alto nivel compartidos, incluyendo, entre otros, la limitación del contexto mediante compresión y gestión, el diseño de recompensas en el aprendizaje por refuerzo para minimizar la invocación de herramientas, y el empleo de mecanismos de búsqueda controlada para mejorar la eficiencia, aspectos que discutimos en detalle. En consecuencia, caracterizamos la eficiencia de dos formas complementarias: comparando la efectividad bajo un presupuesto de coste fijo, y comparando el coste necesario para alcanzar un nivel comparable de efectividad. Esta relación de compromiso también puede visualizarse mediante la frontera de Pareto entre la efectividad y el coste. Desde esta perspectiva, también examinamos benchmarks orientados a la eficiencia resumiendo los protocolos de evaluación para estos componentes y consolidando las métricas de eficiencia comúnmente reportadas tanto en estudios de evaluación comparativa como metodológicos. Además, discutimos los principales desafíos y direcciones futuras, con el objetivo de ofrecer perspectivas prometedoras.
English
Recent years have witnessed increasing interest in extending large language models into agentic systems. While the effectiveness of agents has continued to improve, efficiency, which is crucial for real-world deployment, has often been overlooked. This paper therefore investigates efficiency from three core components of agents: memory, tool learning, and planning, considering costs such as latency, tokens, steps, etc. Aimed at conducting comprehensive research addressing the efficiency of the agentic system itself, we review a broad range of recent approaches that differ in implementation yet frequently converge on shared high-level principles including but not limited to bounding context via compression and management, designing reinforcement learning rewards to minimize tool invocation, and employing controlled search mechanisms to enhance efficiency, which we discuss in detail. Accordingly, we characterize efficiency in two complementary ways: comparing effectiveness under a fixed cost budget, and comparing cost at a comparable level of effectiveness. This trade-off can also be viewed through the Pareto frontier between effectiveness and cost. From this perspective, we also examine efficiency oriented benchmarks by summarizing evaluation protocols for these components and consolidating commonly reported efficiency metrics from both benchmark and methodological studies. Moreover, we discuss the key challenges and future directions, with the goal of providing promising insights.