TAPE: Инструментально-ориентированное адаптивное планирование и ограниченное выполнение в языковых моделях-агентах
TAPE: Tool-Guided Adaptive Planning and Constrained Execution in Language Model Agents
February 23, 2026
Авторы: Jongwon Jeong, Jungtaek Kim, Kangwook Lee
cs.AI
Аннотация
Языковые модели-агенты продемонстрировали впечатляющие способности в решении задач, требующих множественных взаимодействий со средой. Однако они остаются уязвимыми в средах, где единственная ошибка часто приводит к невосстановимому сбою, особенно при строгих ограничениях на выполнимость. Мы систематически анализируем существующие агентские фреймворки, определяя неидеальное планирование и стохастическое исполнение как основные причины. Для решения этих проблем мы предлагаем метод TAPE (Tool-guided Adaptive Planning with constrained Execution — адаптивное планирование с инструментальным руководством и ограниченным исполнением). TAPE улучшает способность к планированию за счёт агрегации множества планов в граф и использования внешнего решателя для поиска выполнимого пути. Во время исполнения TAPE применяет декодирование с ограничениями для снижения шума сэмплирования, одновременно адаптивно перепланируя, когда обратная связь от среды отклоняется от целевого состояния. Эксперименты на Sokoban, ALFWorld, MuSiQue и GSM8K-Hard показывают, что TAPE стабильно превосходит существующие фреймворки, с особенно значительным преимуществом в сложных условиях, повышая процент успешных решений в среднем на 21.0 процентных пункта в сложных условиях и на 20.0 процентных пункта для более слабых базовых моделей. Код и данные доступны по ссылке.
English
Language Model (LM) agents have demonstrated remarkable capabilities in solving tasks that require multiple interactions with the environment. However, they remain vulnerable in environments where a single error often leads to irrecoverable failure, particularly under strict feasibility constraints. We systematically analyze existing agent frameworks, identifying imperfect planning and stochastic execution as the primary causes. To address these challenges, we propose Tool-guided Adaptive Planning with constrained Execution (TAPE). TAPE enhances planning capability by aggregating multiple plans into a graph and employing an external solver to identify a feasible path. During execution, TAPE employs constrained decoding to reduce sampling noise, while adaptively re-planning whenever environmental feedback deviates from the intended state. Experiments across Sokoban, ALFWorld, MuSiQue, and GSM8K-Hard demonstrate that TAPE consistently outperforms existing frameworks, with particularly large gains on hard settings, improving success rates by 21.0 percentage points on hard settings on average, and by 20.0 percentage points for weaker base models on average. Code and data available at here.