Budget-beschränkte agentive große Sprachmodelle: Intentionsbasierte Planung für kostenintensive Werkzeugnutzung
Budget-Constrained Agentic Large Language Models: Intention-Based Planning for Costly Tool Use
February 12, 2026
papers.authors: Hanbing Liu, Chunhao Tian, Nan An, Ziyuan Wang, Pinyan Lu, Changyuan Yu, Qi Qi
cs.AI
papers.abstract
Wir untersuchen budgetbeschränkte, werkzeuggestützte Agenten, bei denen ein großes Sprachmodell mehrstufige Aufgaben lösen muss, indem es externe Werkzeuge unter strikter monetärer Budgetbeschränkung aufruft. Wir formalisieren diese Umgebung als sequenzielle Entscheidungsfindung im Kontextraum mit kostenpflichtigen und stochastischen Werkzeugausführungen, was eine direkte Planung aufgrund massiver Zustands-Aktions-Räume, hoher Ergebnisvarianz und prohibitiv hoher Erkundungskosten undurchführbar macht. Um diese Herausforderungen zu bewältigen, schlagen wir INTENT vor, ein Planungsframework zur Inferenzzeit, das ein intentionsbewusstes hierarchisches Weltmodell nutzt, um zukünftige Werkzeugnutzung und risikokalibrierte Kosten vorherzusehen und Entscheidungen online zu steuern. Auf dem kostenmodifizierten StableToolBench erzwingt INTENT strikte Budgeteinhaltung und verbessert gleichzeitig die Aufgabenbewältigung erheblich gegenüber Baseline-Ansätzen. Zudem bleibt es robust unter dynamischen Marktveränderungen wie Werkzeugpreisänderungen und variierenden Budgets.
English
We study budget-constrained tool-augmented agents, where a large language model must solve multi-step tasks by invoking external tools under a strict monetary budget. We formalize this setting as sequential decision making in context space with priced and stochastic tool executions, making direct planning intractable due to massive state-action spaces, high variance of outcomes and prohibitive exploration cost. To address these challenges, we propose INTENT, an inference-time planning framework that leverages an intention-aware hierarchical world model to anticipate future tool usage, risk-calibrated cost, and guide decisions online. Across cost-augmented StableToolBench, INTENT strictly enforces hard budget feasibility while substantially improving task success over baselines, and remains robust under dynamic market shifts such as tool price changes and varying budgets.