Интерактивное планирование задач с использованием языковых моделей
Interactive Task Planning with Language Models
October 16, 2023
Авторы: Boyi Li, Philipp Wu, Pieter Abbeel, Jitendra Malik
cs.AI
Аннотация
Интерактивная роботизированная система обеспечивает планирование задач на длительный горизонт и легко обобщается для новых целей или различных задач, даже в процессе выполнения. Однако большинство традиционных методов требуют предварительного проектирования модулей, что затрудняет обобщение для разных целей. Современные подходы, основанные на крупных языковых моделях, позволяют более открытое планирование, но часто требуют сложной инженерии промптов или предварительно обученных моделей для конкретных областей. Чтобы решить эту проблему, мы предлагаем простую систему, которая реализует интерактивное планирование задач с использованием языковых моделей. Наша система объединяет как высокоуровневое планирование, так и выполнение низкоуровневых функций через язык. Мы проверяем устойчивость нашей системы в генерации новых высокоуровневых инструкций для неизвестных целей и её легкость адаптации к различным задачам путем простой замены руководств по задачам, без необходимости в дополнительной сложной инженерии промптов. Более того, когда пользователь отправляет новый запрос, наша система способна точно перепланировать на основе нового запроса, руководств по задачам и ранее выполненных шагов. Подробнее можно узнать на наших ресурсах: https://wuphilipp.github.io/itp_site и https://youtu.be/TrKLuyv26_g.
English
An interactive robot framework accomplishes long-horizon task planning and
can easily generalize to new goals or distinct tasks, even during execution.
However, most traditional methods require predefined module design, which makes
it hard to generalize to different goals. Recent large language model based
approaches can allow for more open-ended planning but often require heavy
prompt engineering or domain-specific pretrained models. To tackle this, we
propose a simple framework that achieves interactive task planning with
language models. Our system incorporates both high-level planning and low-level
function execution via language. We verify the robustness of our system in
generating novel high-level instructions for unseen objectives and its ease of
adaptation to different tasks by merely substituting the task guidelines,
without the need for additional complex prompt engineering. Furthermore, when
the user sends a new request, our system is able to replan accordingly with
precision based on the new request, task guidelines and previously executed
steps. Please check more details on our https://wuphilipp.github.io/itp_site
and https://youtu.be/TrKLuyv26_g.