Grandes Modelos de Linguagem Agênticos com Restrição Orçamentária: Planeamento Baseado em Intenção para Uso de Ferramentas com Custos
Budget-Constrained Agentic Large Language Models: Intention-Based Planning for Costly Tool Use
February 12, 2026
Autores: Hanbing Liu, Chunhao Tian, Nan An, Ziyuan Wang, Pinyan Lu, Changyuan Yu, Qi Qi
cs.AI
Resumo
Estudamos agentes aumentados por ferramentas com restrição orçamental, nos quais um modelo de linguagem de grande escala deve resolver tarefas multi-etapa invocando ferramentas externas sob um orçamento monetário rigoroso. Formalizamos este cenário como tomada de decisão sequencial no espaço de contexto com execuções de ferramentas precificadas e estocásticas, tornando o planeamento direto intratável devido aos espaços massivos de estado-ação, alta variância de resultados e custo proibitivo de exploração. Para enfrentar estes desafios, propomos o INTENT, uma estrutura de planeamento em tempo de inferência que aproveita um modelo hierárquico do mundo consciente da intenção para antecipar o uso futuro de ferramentas, custo calibrado para o risco, e orientar decisões online. No StableToolBench com custos aumentados, o INTENT aplica estritamente a viabilidade orçamental rígida enquanto melhora substancialmente o sucesso das tarefas face a linhas de base, e mantém-se robusto sob mudanças dinâmicas de mercado, como alterações de preços de ferramentas e orçamentos variáveis.
English
We study budget-constrained tool-augmented agents, where a large language model must solve multi-step tasks by invoking external tools under a strict monetary budget. We formalize this setting as sequential decision making in context space with priced and stochastic tool executions, making direct planning intractable due to massive state-action spaces, high variance of outcomes and prohibitive exploration cost. To address these challenges, we propose INTENT, an inference-time planning framework that leverages an intention-aware hierarchical world model to anticipate future tool usage, risk-calibrated cost, and guide decisions online. Across cost-augmented StableToolBench, INTENT strictly enforces hard budget feasibility while substantially improving task success over baselines, and remains robust under dynamic market shifts such as tool price changes and varying budgets.