Grands modèles de langage agentiels sous contrainte budgétaire : planification basée sur l’intention pour l’utilisation d’outils coûteux
Budget-Constrained Agentic Large Language Models: Intention-Based Planning for Costly Tool Use
February 12, 2026
papers.authors: Hanbing Liu, Chunhao Tian, Nan An, Ziyuan Wang, Pinyan Lu, Changyuan Yu, Qi Qi
cs.AI
papers.abstract
Nous étudions des agents augmentés par des outils sous contrainte budgétaire, où un grand modèle de langage doit résoudre des tâches multi-étapes en invoquant des outils externes dans le cadre d'un budget monétaire strict. Nous formalisons ce cadre comme une prise de décision séquentielle dans l'espace de contexte avec des exécutions d'outils tarifées et stochastiques, rendant la planification directe intraitable en raison d'espaces d'états-actions massifs, d'une variance élevée des résultats et d'un coût d'exploration prohibitif. Pour relever ces défis, nous proposons INTENT, un cadre de planification à l'inférence qui exploite un modèle hiérarchique du monde sensible aux intentions pour anticiper l'utilisation future des outils, le risque calibré des coûts, et guider les décisions en ligne. Sur le benchmark StableToolBench augmenté des coûts, INTENT applique strictement la faisabilité budgétaire contraignante tout en améliorant substantiellement la réussite des tâches par rapport aux méthodes de référence, et reste robuste face aux changements dynamiques du marché tels que les variations de prix des outils et les budgets variables.
English
We study budget-constrained tool-augmented agents, where a large language model must solve multi-step tasks by invoking external tools under a strict monetary budget. We formalize this setting as sequential decision making in context space with priced and stochastic tool executions, making direct planning intractable due to massive state-action spaces, high variance of outcomes and prohibitive exploration cost. To address these challenges, we propose INTENT, an inference-time planning framework that leverages an intention-aware hierarchical world model to anticipate future tool usage, risk-calibrated cost, and guide decisions online. Across cost-augmented StableToolBench, INTENT strictly enforces hard budget feasibility while substantially improving task success over baselines, and remains robust under dynamic market shifts such as tool price changes and varying budgets.