ChatPaper.aiChatPaper

TAPE : Planification Adaptative Guidée par des Outils et Exécution Contrainte dans les Agents de Modèles de Langage

TAPE: Tool-Guided Adaptive Planning and Constrained Execution in Language Model Agents

February 23, 2026
Auteurs: Jongwon Jeong, Jungtaek Kim, Kangwook Lee
cs.AI

Résumé

Les agents de modèles de langage (LM) ont démontré des capacités remarquables pour résoudre des tâches nécessitant de multiples interactions avec l'environnement. Cependant, ils restent vulnérables dans des environnements où une seule erreur conduit souvent à un échec irrécupérable, particulièrement sous des contraintes de faisabilité strictes. Nous analysons systématiquement les cadres d'agents existants, identifiant la planification imparfaite et l'exécution stochastique comme causes principales. Pour relever ces défis, nous proposons la Planification Adaptative Guidée par les Outils avec Exécution Contrainte (TAPE). TAPE améliore la capacité de planification en agrégeant plusieurs plans en un graphe et en utilisant un solveur externe pour identifier un chemin réalisable. Durant l'exécution, TAPE utilise un décodage contraint pour réduire le bruit d'échantillonnage, tout en replanifiant de manière adaptive dès que la rétroaction environnementale s'écarte de l'état souhaité. Les expériences sur Sokoban, ALFWorld, MuSiQue et GSM8K-Hard démontrent que TAPE surpasse constamment les cadres existants, avec des gains particulièrement importants sur les configurations difficiles, améliorant les taux de réussite de 21,0 points de pourcentage en moyenne sur les configurations difficiles, et de 20,0 points de pourcentage en moyenne pour les modèles de base plus faibles. Code et données disponibles ici.
English
Language Model (LM) agents have demonstrated remarkable capabilities in solving tasks that require multiple interactions with the environment. However, they remain vulnerable in environments where a single error often leads to irrecoverable failure, particularly under strict feasibility constraints. We systematically analyze existing agent frameworks, identifying imperfect planning and stochastic execution as the primary causes. To address these challenges, we propose Tool-guided Adaptive Planning with constrained Execution (TAPE). TAPE enhances planning capability by aggregating multiple plans into a graph and employing an external solver to identify a feasible path. During execution, TAPE employs constrained decoding to reduce sampling noise, while adaptively re-planning whenever environmental feedback deviates from the intended state. Experiments across Sokoban, ALFWorld, MuSiQue, and GSM8K-Hard demonstrate that TAPE consistently outperforms existing frameworks, with particularly large gains on hard settings, improving success rates by 21.0 percentage points on hard settings on average, and by 20.0 percentage points for weaker base models on average. Code and data available at here.
PDF72March 28, 2026