Бюджетно-ограниченные агентные большие языковые модели: планирование на основе намерений для использования ресурсоемких инструментов
Budget-Constrained Agentic Large Language Models: Intention-Based Planning for Costly Tool Use
February 12, 2026
Авторы: Hanbing Liu, Chunhao Tian, Nan An, Ziyuan Wang, Pinyan Lu, Changyuan Yu, Qi Qi
cs.AI
Аннотация
Мы исследуем агентов, расширенных инструментами и ограниченных бюджетом, где большая языковая модель должна решать многошаговые задачи, вызывая внешние инструменты в условиях строгого денежного лимита. Мы формализуем эту задачу как последовательное принятие решений в контекстном пространстве с платным и стохастическим выполнением инструментов, что делает прямое планирование неосуществимым из-за огромных пространств состояний-действий, высокой дисперсии результатов и запретительной стоимости исследования. Для решения этих проблем мы предлагаем INTENT — фреймворк планирования на этапе вывода, который использует иерархическую модель мира с учетом намерений для прогнозирования будущего использования инструментов, калиброванного по риску, и онлайн-направления решений. На cost-augmented StableToolBench INTENT строго обеспечивает выполнение жестких бюджетных ограничений, существенно повышая успешность выполнения задач по сравнению с базовыми методами, и сохраняет устойчивость при динамических рыночных изменениях, таких как колебания цен на инструменты и вариативные бюджеты.
English
We study budget-constrained tool-augmented agents, where a large language model must solve multi-step tasks by invoking external tools under a strict monetary budget. We formalize this setting as sequential decision making in context space with priced and stochastic tool executions, making direct planning intractable due to massive state-action spaces, high variance of outcomes and prohibitive exploration cost. To address these challenges, we propose INTENT, an inference-time planning framework that leverages an intention-aware hierarchical world model to anticipate future tool usage, risk-calibrated cost, and guide decisions online. Across cost-augmented StableToolBench, INTENT strictly enforces hard budget feasibility while substantially improving task success over baselines, and remains robust under dynamic market shifts such as tool price changes and varying budgets.