Verso Agenti Efficienti: Memoria, Apprendimento di Strumenti e Pianificazione

Abstract

Negli ultimi anni si è registrato un crescente interesse nell'estendere i grandi modelli linguistici verso sistemi agentivi. Sebbene l'efficacia degli agenti continui a migliorare, l'efficienza, cruciale per il dispiegamento nel mondo reale, è stata spesso trascurata. Questo articolo investiga pertanto l'efficienza partendo da tre componenti fondamentali degli agenti: la memoria, l'apprendimento dell'uso di strumenti (tool learning) e la pianificazione, considerando costi quali la latenza, il numero di token, i passi computazionali, ecc. Con l'obiettivo di condurre una ricerca completa che affronti l'efficienza del sistema agente stesso, passiamo in rassegna un'ampia gamma di approcci recenti che differiscono nell'implementazione ma convergono frequentemente su principi di alto livello condivisi, inclusi, ma non limitati a: delimitare il contesto tramite compressione e gestione, progettare ricompense per l'apprendimento per rinforzo che minimizzino l'invocazione di strumenti, e impiegare meccanismi di ricerca controllata per migliorare l'efficienza, i quali vengono discussi in dettaglio. Di conseguenza, caratterizziamo l'efficienza in due modi complementari: confrontando l'efficacia con un budget di costo fisso e confrontando il costo a un livello paragonabile di efficacia. Questo compromesso può essere visto anche attraverso la frontiera di Pareto tra efficacia e costo. Da questa prospettiva, esaminiamo anche benchmark orientati all'efficienza, sintetizzando i protocolli di valutazione per queste componenti e consolidando le metriche di efficienza comunemente riportate sia negli studi metodologici che in quelli sui benchmark. Inoltre, discutiamo le principali sfide e le direzioni future, con l'obiettivo di fornire spunti promettenti.

English

Recent years have witnessed increasing interest in extending large language models into agentic systems. While the effectiveness of agents has continued to improve, efficiency, which is crucial for real-world deployment, has often been overlooked. This paper therefore investigates efficiency from three core components of agents: memory, tool learning, and planning, considering costs such as latency, tokens, steps, etc. Aimed at conducting comprehensive research addressing the efficiency of the agentic system itself, we review a broad range of recent approaches that differ in implementation yet frequently converge on shared high-level principles including but not limited to bounding context via compression and management, designing reinforcement learning rewards to minimize tool invocation, and employing controlled search mechanisms to enhance efficiency, which we discuss in detail. Accordingly, we characterize efficiency in two complementary ways: comparing effectiveness under a fixed cost budget, and comparing cost at a comparable level of effectiveness. This trade-off can also be viewed through the Pareto frontier between effectiveness and cost. From this perspective, we also examine efficiency oriented benchmarks by summarizing evaluation protocols for these components and consolidating commonly reported efficiency metrics from both benchmark and methodological studies. Moreover, we discuss the key challenges and future directions, with the goal of providing promising insights.

Verso Agenti Efficienti: Memoria, Apprendimento di Strumenti e Pianificazione

Toward Efficient Agents: Memory, Tool learning, and Planning

Abstract

Support