К эффективным агентам: память, обучение работе с инструментами и планирование
Toward Efficient Agents: Memory, Tool learning, and Planning
January 20, 2026
Авторы: Xiaofang Yang, Lijun Li, Heng Zhou, Tong Zhu, Xiaoye Qu, Yuchen Fan, Qianshan Wei, Rui Ye, Li Kang, Yiran Qin, Zhiqiang Kou, Daizong Liu, Qi Li, Ning Ding, Siheng Chen, Jing Shao
cs.AI
Аннотация
В последние годы наблюдается растущий интерес к расширению возможностей больших языковых моделей в сторону создания агентных систем. Хотя эффективность агентов продолжает повышаться, их производительность — ключевой фактор для реального развертывания — часто остается без должного внимания. В данной статье мы исследуем производительность с точки зрения трех основных компонентов агентов: памяти, обучения работе с инструментами и планирования, учитывая такие затраты, как задержка, количество токенов, шаги выполнения и т.д. Стремясь провести всестороннее исследование, посвященное производительности самой агентной системы, мы рассматриваем широкий спектр современных подходов, которые различаются в реализации, но часто сходятся на общих принципах высокого уровня, включая, но не ограничиваясь: ограничение контекста за счет сжатия и управления, проектирование вознаграждений в обучении с подкреплением для минимизации вызовов инструментов и использование контролируемых механизмов поиска для повышения эффективности, что мы подробно обсуждаем. Соответственно, мы характеризуем производительность двумя взаимодополняющими способами: сравнение эффективности при фиксированном бюджете затрат и сравнение затрат при сопоставимом уровне эффективности. Этот компромисс также можно рассматривать через призму границы Парето между эффективностью и затратами. С этой точки зрения мы также анализируем ориентированные на производительность бенчмарки, обобщая протоколы оценки для этих компонентов и консолидируя часто используемые метрики производительности как из бенчмарков, так и из методических исследований. Кроме того, мы обсуждаем ключевые проблемы и перспективные направления, с целью предоставить полезные инсайты.
English
Recent years have witnessed increasing interest in extending large language models into agentic systems. While the effectiveness of agents has continued to improve, efficiency, which is crucial for real-world deployment, has often been overlooked. This paper therefore investigates efficiency from three core components of agents: memory, tool learning, and planning, considering costs such as latency, tokens, steps, etc. Aimed at conducting comprehensive research addressing the efficiency of the agentic system itself, we review a broad range of recent approaches that differ in implementation yet frequently converge on shared high-level principles including but not limited to bounding context via compression and management, designing reinforcement learning rewards to minimize tool invocation, and employing controlled search mechanisms to enhance efficiency, which we discuss in detail. Accordingly, we characterize efficiency in two complementary ways: comparing effectiveness under a fixed cost budget, and comparing cost at a comparable level of effectiveness. This trade-off can also be viewed through the Pareto frontier between effectiveness and cost. From this perspective, we also examine efficiency oriented benchmarks by summarizing evaluation protocols for these components and consolidating commonly reported efficiency metrics from both benchmark and methodological studies. Moreover, we discuss the key challenges and future directions, with the goal of providing promising insights.