Vers des agents efficaces : Mémoire, apprentissage d'outils et planification
Toward Efficient Agents: Memory, Tool learning, and Planning
January 20, 2026
papers.authors: Xiaofang Yang, Lijun Li, Heng Zhou, Tong Zhu, Xiaoye Qu, Yuchen Fan, Qianshan Wei, Rui Ye, Li Kang, Yiran Qin, Zhiqiang Kou, Daizong Liu, Qi Li, Ning Ding, Siheng Chen, Jing Shao
cs.AI
papers.abstract
Ces dernières années ont vu un intérêt croissant pour l'extension des grands modèles de langage en systèmes agentiques. Bien que l'efficacité des agents n'ait cessé de s'améliorer, l'efficience, cruciale pour un déploiement réel, a souvent été négligée. Cet article étudie donc l'efficience sous l'angle de trois composantes fondamentales des agents : la mémoire, l'apprentissage d'outils et la planification, en considérant des coûts tels que la latence, le nombre de tokens, les étapes, etc. Visant à mener une recherche exhaustive sur l'efficience du système agentique lui-même, nous passons en revue un large éventail d'approches récentes qui diffèrent dans leur mise en œuvre mais convergent fréquemment vers des principes de haut niveau communs, notamment, sans s'y limiter, la limitation du contexte via la compression et la gestion, la conception de récompenses d'apprentissage par renforcement pour minimiser l'invocation d'outils, et l'utilisation de mécanismes de recherche contrôlée pour améliorer l'efficience, que nous discutons en détail. En conséquence, nous caractérisons l'efficience de deux manières complémentaires : en comparant l'efficacité sous un budget de coût fixe, et en comparant le coût pour un niveau d'efficacité comparable. Ce compromis peut également être visualisé via la frontière de Pareto entre l'efficacité et le coût. Dans cette perspective, nous examinons également les benchmarks axés sur l'efficience en résumant les protocoles d'évaluation pour ces composantes et en consolidant les métriques d'efficience couramment rapportées dans les études méthodologiques et de benchmark. De plus, nous discutons des défis clés et des orientations futures, dans le but de fournir des perspectives prometteuses.
English
Recent years have witnessed increasing interest in extending large language models into agentic systems. While the effectiveness of agents has continued to improve, efficiency, which is crucial for real-world deployment, has often been overlooked. This paper therefore investigates efficiency from three core components of agents: memory, tool learning, and planning, considering costs such as latency, tokens, steps, etc. Aimed at conducting comprehensive research addressing the efficiency of the agentic system itself, we review a broad range of recent approaches that differ in implementation yet frequently converge on shared high-level principles including but not limited to bounding context via compression and management, designing reinforcement learning rewards to minimize tool invocation, and employing controlled search mechanisms to enhance efficiency, which we discuss in detail. Accordingly, we characterize efficiency in two complementary ways: comparing effectiveness under a fixed cost budget, and comparing cost at a comparable level of effectiveness. This trade-off can also be viewed through the Pareto frontier between effectiveness and cost. From this perspective, we also examine efficiency oriented benchmarks by summarizing evaluation protocols for these components and consolidating commonly reported efficiency metrics from both benchmark and methodological studies. Moreover, we discuss the key challenges and future directions, with the goal of providing promising insights.