ChatPaper.aiChatPaper

Agenti di Large Language Model con Vincoli di Budget: Pianificazione Basata sull'Intenzione per l'Uso di Strumenti Costosi

Budget-Constrained Agentic Large Language Models: Intention-Based Planning for Costly Tool Use

February 12, 2026
Autori: Hanbing Liu, Chunhao Tian, Nan An, Ziyuan Wang, Pinyan Lu, Changyuan Yu, Qi Qi
cs.AI

Abstract

Studiamo agenti potenziati da strumenti con vincoli di budget, in cui un modello linguistico di grandi dimensioni deve risolvere compiti multi-step invocando strumenti esterni sotto un rigido budget monetario. Formalizziamo questo scenario come un processo decisionale sequenziale nello spazio contestuale con esecuzioni di strumenti a costo variabile e stocastiche, rendendo la pianificazione diretta intrattabile a causa degli spazi di stati-azione massivi, dell'elevata varianza degli esiti e del costo proibitivo dell'esplorazione. Per affrontare queste sfide, proponiamo INTENT, un framework di pianificazione in fase di inferenza che sfrutta un modello gerarchico del mondo consapevole delle intenzioni per anticipare l'uso futuro degli strumenti, il rischio calibrato dei costi e guidare le decisioni online. Su StableToolBench arricchito con costi, INTENT applica rigorosamente la fattibilità del budget rigido migliorando sostanzialmente il successo dei compiti rispetto ai baseline e rimanendo robusto sotto cambiamenti dinamici di mercato come variazioni dei prezzi degli strumenti e budget flessibili.
English
We study budget-constrained tool-augmented agents, where a large language model must solve multi-step tasks by invoking external tools under a strict monetary budget. We formalize this setting as sequential decision making in context space with priced and stochastic tool executions, making direct planning intractable due to massive state-action spaces, high variance of outcomes and prohibitive exploration cost. To address these challenges, we propose INTENT, an inference-time planning framework that leverages an intention-aware hierarchical world model to anticipate future tool usage, risk-calibrated cost, and guide decisions online. Across cost-augmented StableToolBench, INTENT strictly enforces hard budget feasibility while substantially improving task success over baselines, and remains robust under dynamic market shifts such as tool price changes and varying budgets.
PDF32March 17, 2026