Naar efficiënte agenten: Geheugen, gereedschapsleren en planning

Samenvatting

De laatste jaren is er een groeiende belangstelling voor het uitbreiden van grote taalmodel(len) naar agent-gebaseerde systemen. Hoewel de effectiviteit van agents voortdurend verbetert, wordt de efficiëntie, die cruciaal is voor inzet in de praktijk, vaak over het hoofd gezien. Dit artikel onderzoekt daarom de efficiëntie aan de hand van drie kernelementen van agents: geheugen, tool-gebruik en planning, waarbij rekening wordt gehouden met kosten zoals latentie, tokens, stappen, enz. Met als doel een uitgebreid onderzoek uit te voeren naar de efficiëntie van het agent-systeem zelf, bespreken we een breed scala aan recente benaderingen die verschillen in implementatie, maar vaak terugvallen op gedeelde principes op hoog niveau, waaronder (maar niet beperkt tot) het begrenzen van context via compressie en beheer, het ontwerpen van reinforcement learning-beloningen om tool-aanroepen te minimaliseren, en het inzetten van gecontroleerde zoekmechanismen om de efficiëntie te verbeteren, hetgeen we gedetailleerd bespreken. Dienovereenkomstig karakteriseren we efficiëntie op twee complementaire manieren: het vergelijken van effectiviteit onder een vast kostenbudget, en het vergelijken van kosten bij een vergelijkbaar niveau van effectiviteit. Deze afweging kan ook worden bekeken door de Pareto-frontier tussen effectiviteit en kosten. Vanuit dit perspectief onderzoeken we ook op efficiëntie gerichte benchmarks door evaluatieprotocollen voor deze componenten samen te vatten en veelgebruikte efficiëntiemetrieken uit zowel benchmark- als methodologische studies te consolideren. Bovendien bespreken we de belangrijkste uitdagingen en toekomstige richtingen, met als doel veelbelovende inzichten te bieden.

English

Recent years have witnessed increasing interest in extending large language models into agentic systems. While the effectiveness of agents has continued to improve, efficiency, which is crucial for real-world deployment, has often been overlooked. This paper therefore investigates efficiency from three core components of agents: memory, tool learning, and planning, considering costs such as latency, tokens, steps, etc. Aimed at conducting comprehensive research addressing the efficiency of the agentic system itself, we review a broad range of recent approaches that differ in implementation yet frequently converge on shared high-level principles including but not limited to bounding context via compression and management, designing reinforcement learning rewards to minimize tool invocation, and employing controlled search mechanisms to enhance efficiency, which we discuss in detail. Accordingly, we characterize efficiency in two complementary ways: comparing effectiveness under a fixed cost budget, and comparing cost at a comparable level of effectiveness. This trade-off can also be viewed through the Pareto frontier between effectiveness and cost. From this perspective, we also examine efficiency oriented benchmarks by summarizing evaluation protocols for these components and consolidating commonly reported efficiency metrics from both benchmark and methodological studies. Moreover, we discuss the key challenges and future directions, with the goal of providing promising insights.

Naar efficiënte agenten: Geheugen, gereedschapsleren en planning

Toward Efficient Agents: Memory, Tool learning, and Planning

Samenvatting

Support