ChatPaper.aiChatPaper

Budgetbeperkte Agentiële Grote Taalmodellen: Intentiegebaseerde Planning voor Kostbaar Hulpmiddelengebruik

Budget-Constrained Agentic Large Language Models: Intention-Based Planning for Costly Tool Use

February 12, 2026
Auteurs: Hanbing Liu, Chunhao Tian, Nan An, Ziyuan Wang, Pinyan Lu, Changyuan Yu, Qi Qi
cs.AI

Samenvatting

Wij bestuderen budgetbeperkte tool-augmented agents, waarbij een groot taalmodel meerstappentaken moet oplossen door externe tools aan te roepen onder een strikt monetair budget. Wij formaliseren deze setting als sequentiële besluitvorming in contextruimte met geprijsde en stochastische tooluitvoeringen, wat directe planning onhanteerbaar maakt door enorme toestand-actieruimten, hoge variantie van uitkomsten en verboden exploratiekosten. Om deze uitdagingen aan te pakken, stellen wij INTENT voor, een inference-time planningframework dat gebruikmaakt van een hiërarchisch wereldmodel met intentiebewustzijn om toekomstig toolgebruik en risicogecalibreerde kosten te anticiperen, en beslissingen online te sturen. Op de kostentoegenomen StableToolBench handhaaft INTENT strikte budgetuitvoerbaarheid terwijl de taaksucces aanzienlijk verbetert ten opzichte van de basislijnen, en blijft het robuust onder dynamische marktverschuivingen zoals toolprijswijzigingen en variërende budgetten.
English
We study budget-constrained tool-augmented agents, where a large language model must solve multi-step tasks by invoking external tools under a strict monetary budget. We formalize this setting as sequential decision making in context space with priced and stochastic tool executions, making direct planning intractable due to massive state-action spaces, high variance of outcomes and prohibitive exploration cost. To address these challenges, we propose INTENT, an inference-time planning framework that leverages an intention-aware hierarchical world model to anticipate future tool usage, risk-calibrated cost, and guide decisions online. Across cost-augmented StableToolBench, INTENT strictly enforces hard budget feasibility while substantially improving task success over baselines, and remains robust under dynamic market shifts such as tool price changes and varying budgets.
PDF32March 17, 2026