TAPE: Werkzeuggesteuerte adaptive Planung und eingeschränkte Ausführung in Sprachmodell-Agenten
TAPE: Tool-Guided Adaptive Planning and Constrained Execution in Language Model Agents
February 23, 2026
Autoren: Jongwon Jeong, Jungtaek Kim, Kangwook Lee
cs.AI
Zusammenfassung
Sprachmodell-Agenten (LM) haben beeindruckende Fähigkeiten bei der Lösung von Aufgaben gezeigt, die mehrere Interaktionen mit der Umgebung erfordern. Sie bleiben jedoch anfällig in Umgebungen, in denen ein einzelner Fehler häufig zu nicht behebbarem Scheitern führt, insbesondere unter strengen Durchführbarkeitsbedingungen. Wir analysieren systematisch bestehende Agenten-Frameworks und identifizieren unvollständige Planung und stochastische Ausführung als Hauptursachen. Um diese Herausforderungen zu bewältigen, schlagen wir Tool-guided Adaptive Planning with constrained Execution (TAPE) vor. TAPE verbessert die Planungsfähigkeit, indem mehrere Pläne in einem Graphen aggregiert werden und ein externer Solver zur Identifikation eines machbaren Pfades eingesetzt wird. Während der Ausführung nutzt TAPE constrained Decoding, um Rauschen bei der Stichprobenziehung zu reduzieren, und passt die Planung dynamisch an, sobald Umweltfeedback vom beabsichtigten Zustand abweicht. Experimente mit Sokoban, ALFWorld, MuSiQue und GSM8K-Hard zeigen, dass TAPE durchgängig bestehende Frameworks übertrifft, mit besonders großen Verbesserungen in schwierigen Szenarien. Die Erfolgsrate steigt im Durchschnitt um 21,0 Prozentpunkte bei schwierigen Einstellungen und um 20,0 Prozentpunkte für schwächere Basismodelle. Code und Daten verfügbar unter hier.
English
Language Model (LM) agents have demonstrated remarkable capabilities in solving tasks that require multiple interactions with the environment. However, they remain vulnerable in environments where a single error often leads to irrecoverable failure, particularly under strict feasibility constraints. We systematically analyze existing agent frameworks, identifying imperfect planning and stochastic execution as the primary causes. To address these challenges, we propose Tool-guided Adaptive Planning with constrained Execution (TAPE). TAPE enhances planning capability by aggregating multiple plans into a graph and employing an external solver to identify a feasible path. During execution, TAPE employs constrained decoding to reduce sampling noise, while adaptively re-planning whenever environmental feedback deviates from the intended state. Experiments across Sokoban, ALFWorld, MuSiQue, and GSM8K-Hard demonstrate that TAPE consistently outperforms existing frameworks, with particularly large gains on hard settings, improving success rates by 21.0 percentage points on hard settings on average, and by 20.0 percentage points for weaker base models on average. Code and data available at here.