ChatPaper.aiChatPaper

Бюджетно-ограниченные агентные большие языковые модели: планирование на основе намерений для использования ресурсоемких инструментов

Budget-Constrained Agentic Large Language Models: Intention-Based Planning for Costly Tool Use

February 12, 2026
Авторы: Hanbing Liu, Chunhao Tian, Nan An, Ziyuan Wang, Pinyan Lu, Changyuan Yu, Qi Qi
cs.AI

Аннотация

Мы исследуем агентов, расширенных инструментами и ограниченных бюджетом, где большая языковая модель должна решать многошаговые задачи, вызывая внешние инструменты в условиях строгого денежного лимита. Мы формализуем эту задачу как последовательное принятие решений в контекстном пространстве с платным и стохастическим выполнением инструментов, что делает прямое планирование неосуществимым из-за огромных пространств состояний-действий, высокой дисперсии результатов и запретительной стоимости исследования. Для решения этих проблем мы предлагаем INTENT — фреймворк планирования на этапе вывода, который использует иерархическую модель мира с учетом намерений для прогнозирования будущего использования инструментов, калиброванного по риску, и онлайн-направления решений. На cost-augmented StableToolBench INTENT строго обеспечивает выполнение жестких бюджетных ограничений, существенно повышая успешность выполнения задач по сравнению с базовыми методами, и сохраняет устойчивость при динамических рыночных изменениях, таких как колебания цен на инструменты и вариативные бюджеты.
English
We study budget-constrained tool-augmented agents, where a large language model must solve multi-step tasks by invoking external tools under a strict monetary budget. We formalize this setting as sequential decision making in context space with priced and stochastic tool executions, making direct planning intractable due to massive state-action spaces, high variance of outcomes and prohibitive exploration cost. To address these challenges, we propose INTENT, an inference-time planning framework that leverages an intention-aware hierarchical world model to anticipate future tool usage, risk-calibrated cost, and guide decisions online. Across cost-augmented StableToolBench, INTENT strictly enforces hard budget feasibility while substantially improving task success over baselines, and remains robust under dynamic market shifts such as tool price changes and varying budgets.
PDF31February 14, 2026