TAPE: Pianificazione Adattiva Guidata da Strumenti ed Esecuzione Vincolata negli Agenti a Modello Linguistico
TAPE: Tool-Guided Adaptive Planning and Constrained Execution in Language Model Agents
February 23, 2026
Autori: Jongwon Jeong, Jungtaek Kim, Kangwook Lee
cs.AI
Abstract
Gli agenti basati su modelli linguistici (LM) hanno dimostrato capacità notevoli nel risolvere compiti che richiedono molteplici interazioni con l'ambiente. Tuttavia, rimangono vulnerabili in ambienti dove un singolo errore porta spesso a un fallimento irreversibile, specialmente sotto vincoli di fattibilità stringenti. Analizziamo sistematicamente i framework agent esistenti, identificando nella pianificazione imperfetta e nell'esecuzione stocastica le cause primarie. Per affrontare queste sfide, proponiamo Tool-guided Adaptive Planning with constrained Execution (TAPE). TAPE potenzia la capacità di pianificazione aggregando molteplici piani in un grafo e impiegando un risolutore esterno per identificare un percorso fattibile. Durante l'esecuzione, TAPE utilizza il decoding vincolato per ridurre il rumore di campionamento, mentre ri-pianifica in modo adattivo ogni qualvolta il feedback ambientale devia dallo stato previsto. Esperimenti condotti su Sokoban, ALFWorld, MuSiQue e GSM8K-Hard dimostrano che TAPE supera costantemente i framework esistenti, con vantaggi particolarmente ampi su impostazioni difficili, migliorando i tassi di successo di 21,0 punti percentuali in media su scenari complessi e di 20,0 punti percentuali per modelli base più deboli in media. Codice e dati disponibili qui.
English
Language Model (LM) agents have demonstrated remarkable capabilities in solving tasks that require multiple interactions with the environment. However, they remain vulnerable in environments where a single error often leads to irrecoverable failure, particularly under strict feasibility constraints. We systematically analyze existing agent frameworks, identifying imperfect planning and stochastic execution as the primary causes. To address these challenges, we propose Tool-guided Adaptive Planning with constrained Execution (TAPE). TAPE enhances planning capability by aggregating multiple plans into a graph and employing an external solver to identify a feasible path. During execution, TAPE employs constrained decoding to reduce sampling noise, while adaptively re-planning whenever environmental feedback deviates from the intended state. Experiments across Sokoban, ALFWorld, MuSiQue, and GSM8K-Hard demonstrate that TAPE consistently outperforms existing frameworks, with particularly large gains on hard settings, improving success rates by 21.0 percentage points on hard settings on average, and by 20.0 percentage points for weaker base models on average. Code and data available at here.