ChatPaper.aiChatPaper

Auf dem Weg zu effizienten Agenten: Gedächtnis, Werkzeugnutzung und Planung

Toward Efficient Agents: Memory, Tool learning, and Planning

January 20, 2026
papers.authors: Xiaofang Yang, Lijun Li, Heng Zhou, Tong Zhu, Xiaoye Qu, Yuchen Fan, Qianshan Wei, Rui Ye, Li Kang, Yiran Qin, Zhiqiang Kou, Daizong Liu, Qi Li, Ning Ding, Siheng Chen, Jing Shao
cs.AI

papers.abstract

In den letzten Jahren ist das Interesse an der Erweiterung großer Sprachmodelle zu agentenbasierten Systemen stetig gewachsen. Während die Effektivität von Agenten kontinuierlich gesteigert wurde, wurde die Effizienz, die für den realen Einsatz entscheidend ist, oft vernachlässigt. Diese Arbeit untersucht daher die Effizienz anhand drei zentraler Komponenten von Agenten: Gedächtnis, Werkzeugnutzung und Planung, unter Berücksichtigung von Kosten wie Latenz, Token-Verbrauch und Schrittzahl. Mit dem Ziel, eine umfassende Untersuchung der Effizienz agentenbasierter Systeme selbst durchzuführen, betrachten wir eine Vielzahl aktueller Ansätze, die sich in der Implementierung unterscheiden, aber häufig auf gemeinsame übergeordnete Prinzipien zurückgreifen. Dazu zählen unter anderem die Begrenzung des Kontexts durch Kompression und Verwaltung, die Gestaltung von Belohnungsfunktionen im Reinforcement Learning zur Minimierung von Werkzeugaufrufen sowie der Einsatz kontrollierter Suchmechanismen zur Effizienzsteigerung, die wir im Detail diskutieren. Dementsprechend charakterisieren wir Effizienz auf zwei komplementäre Weisen: durch den Vergleich der Effektivität unter einem festen Kostenbudget und durch den Vergleich der Kosten bei vergleichbarem Effektivitätsniveau. Dieser Trade-off lässt sich auch durch die Pareto-Grenze zwischen Effektivität und Kosten betrachten. Aus dieser Perspektive untersuchen wir auch effizienzorientierte Benchmarks, indem wir Evaluierungsprotokolle für diese Komponenten zusammenfassen und häufig berichtete Effizienzkennzahlen aus Benchmark- und Methodenstudien konsolidieren. Darüber hinaus diskutieren wir die wichtigsten Herausforderungen und zukünftige Richtungen, mit dem Ziel, vielversprechende Einblicke zu bieten.
English
Recent years have witnessed increasing interest in extending large language models into agentic systems. While the effectiveness of agents has continued to improve, efficiency, which is crucial for real-world deployment, has often been overlooked. This paper therefore investigates efficiency from three core components of agents: memory, tool learning, and planning, considering costs such as latency, tokens, steps, etc. Aimed at conducting comprehensive research addressing the efficiency of the agentic system itself, we review a broad range of recent approaches that differ in implementation yet frequently converge on shared high-level principles including but not limited to bounding context via compression and management, designing reinforcement learning rewards to minimize tool invocation, and employing controlled search mechanisms to enhance efficiency, which we discuss in detail. Accordingly, we characterize efficiency in two complementary ways: comparing effectiveness under a fixed cost budget, and comparing cost at a comparable level of effectiveness. This trade-off can also be viewed through the Pareto frontier between effectiveness and cost. From this perspective, we also examine efficiency oriented benchmarks by summarizing evaluation protocols for these components and consolidating commonly reported efficiency metrics from both benchmark and methodological studies. Moreover, we discuss the key challenges and future directions, with the goal of providing promising insights.
PDF292January 22, 2026