ChatPaper.aiChatPaper

TAPE: Planificación Adaptativa Guiada por Herramientas y Ejecución Restringida en Agentes de Modelos de Lenguaje

TAPE: Tool-Guided Adaptive Planning and Constrained Execution in Language Model Agents

February 23, 2026
Autores: Jongwon Jeong, Jungtaek Kim, Kangwook Lee
cs.AI

Resumen

Los agentes de modelos de lenguaje han demostrado capacidades notables para resolver tareas que requieren múltiples interacciones con el entorno. Sin embargo, siguen siendo vulnerables en entornos donde un solo error suele conducir a un fallo irrecuperable, particularmente bajo restricciones estrictas de viabilidad. Analizamos sistemáticamente los marcos de agentes existentes, identificando la planificación imperfecta y la ejecución estocástica como las causas principales. Para abordar estos desafíos, proponemos Planificación Adaptativa Guiada por Herramientas con Ejecución Restringida (TAPE). TAPE mejora la capacidad de planificación mediante la agregación de múltiples planes en un grafo y el empleo de un solucionador externo para identificar una ruta viable. Durante la ejecución, TAPE utiliza decodificación restringida para reducir el ruido de muestreo, mientras replanifica de forma adaptativa cuando la retroalimentación del entorno se desvía del estado previsto. Los experimentos en Sokoban, ALFWorld, MuSiQue y GSM8K-Hard demuestran que TAPE supera consistentemente a los marcos existentes, con ganancias particularmente grandes en configuraciones difíciles, mejorando las tasas de éxito en 21.0 puntos porcentuales en promedio en entornos complejos, y en 20.0 puntos porcentuales para modelos base más débiles en promedio. Código y datos disponibles aquí.
English
Language Model (LM) agents have demonstrated remarkable capabilities in solving tasks that require multiple interactions with the environment. However, they remain vulnerable in environments where a single error often leads to irrecoverable failure, particularly under strict feasibility constraints. We systematically analyze existing agent frameworks, identifying imperfect planning and stochastic execution as the primary causes. To address these challenges, we propose Tool-guided Adaptive Planning with constrained Execution (TAPE). TAPE enhances planning capability by aggregating multiple plans into a graph and employing an external solver to identify a feasible path. During execution, TAPE employs constrained decoding to reduce sampling noise, while adaptively re-planning whenever environmental feedback deviates from the intended state. Experiments across Sokoban, ALFWorld, MuSiQue, and GSM8K-Hard demonstrate that TAPE consistently outperforms existing frameworks, with particularly large gains on hard settings, improving success rates by 21.0 percentage points on hard settings on average, and by 20.0 percentage points for weaker base models on average. Code and data available at here.
PDF72March 28, 2026