ChatPaper.aiChatPaper

FITA: Planejamento Adaptativo Orientado por Ferramentas e Execução Restrita em Agentes de Modelo de Linguagem

TAPE: Tool-Guided Adaptive Planning and Constrained Execution in Language Model Agents

February 23, 2026
Autores: Jongwon Jeong, Jungtaek Kim, Kangwook Lee
cs.AI

Resumo

Os agentes de Modelos de Linguagem (LM) demonstraram capacidades notáveis na resolução de tarefas que exigem múltiplas interações com o ambiente. No entanto, eles permanecem vulneráveis em ambientes onde um único erro frequentemente leva a uma falha irrecuperável, particularmente sob restrições rigorosas de viabilidade. Analisamos sistematicamente as estruturas de agentes existentes, identificando o planeamento imperfeito e a execução estocástica como as causas primárias. Para enfrentar estes desafios, propomos o Planeamento Adaptativo Guiado por Ferramentas com Execução Restrita (TAPE). O TAPE melhora a capacidade de planeamento agregando múltiplos planos num grafo e empregando um solucionador externo para identificar um caminho viável. Durante a execução, o TAPE emprega descodificação restrita para reduzir o ruído de amostragem, enquanto replaneia adaptativamente sempre que o *feedback* ambiental se desvia do estado pretendido. Experiências realizadas em Sokoban, ALFWorld, MuSiQue e GSM8K-Hard demonstram que o TAPE supera consistentemente as estruturas existentes, com ganhos particularmente grandes em configurações difíceis, melhorando as taxas de sucesso em 21,0 pontos percentuais em média em configurações difíceis, e em 20,0 pontos percentuais para modelos base mais fracos em média. Código e dados disponíveis em [aqui].
English
Language Model (LM) agents have demonstrated remarkable capabilities in solving tasks that require multiple interactions with the environment. However, they remain vulnerable in environments where a single error often leads to irrecoverable failure, particularly under strict feasibility constraints. We systematically analyze existing agent frameworks, identifying imperfect planning and stochastic execution as the primary causes. To address these challenges, we propose Tool-guided Adaptive Planning with constrained Execution (TAPE). TAPE enhances planning capability by aggregating multiple plans into a graph and employing an external solver to identify a feasible path. During execution, TAPE employs constrained decoding to reduce sampling noise, while adaptively re-planning whenever environmental feedback deviates from the intended state. Experiments across Sokoban, ALFWorld, MuSiQue, and GSM8K-Hard demonstrate that TAPE consistently outperforms existing frameworks, with particularly large gains on hard settings, improving success rates by 21.0 percentage points on hard settings on average, and by 20.0 percentage points for weaker base models on average. Code and data available at here.
PDF72March 28, 2026