Planejamento Interativo de Tarefas com Modelos de Linguagem
Interactive Task Planning with Language Models
October 16, 2023
Autores: Boyi Li, Philipp Wu, Pieter Abbeel, Jitendra Malik
cs.AI
Resumo
Um framework de robô interativo realiza o planejamento de tarefas de longo prazo e pode facilmente generalizar para novos objetivos ou tarefas distintas, mesmo durante a execução. No entanto, a maioria dos métodos tradicionais exige um design de módulo predefinido, o que dificulta a generalização para diferentes objetivos. Abordagens recentes baseadas em modelos de linguagem de grande escala permitem um planejamento mais aberto, mas frequentemente exigem engenharia de prompt complexa ou modelos pré-treinados específicos de domínio. Para resolver isso, propomos um framework simples que alcança o planejamento interativo de tarefas com modelos de linguagem. Nosso sistema incorpora tanto o planejamento de alto nível quanto a execução de funções de baixo nível por meio da linguagem. Verificamos a robustez do nosso sistema na geração de instruções de alto nível para objetivos não vistos e sua facilidade de adaptação a diferentes tarefas apenas substituindo as diretrizes da tarefa, sem a necessidade de engenharia de prompt adicional complexa. Além disso, quando o usuário envia uma nova solicitação, nosso sistema é capaz de replanejar com precisão com base na nova solicitação, nas diretrizes da tarefa e nas etapas previamente executadas. Para mais detalhes, consulte https://wuphilipp.github.io/itp_site e https://youtu.be/TrKLuyv26_g.
English
An interactive robot framework accomplishes long-horizon task planning and
can easily generalize to new goals or distinct tasks, even during execution.
However, most traditional methods require predefined module design, which makes
it hard to generalize to different goals. Recent large language model based
approaches can allow for more open-ended planning but often require heavy
prompt engineering or domain-specific pretrained models. To tackle this, we
propose a simple framework that achieves interactive task planning with
language models. Our system incorporates both high-level planning and low-level
function execution via language. We verify the robustness of our system in
generating novel high-level instructions for unseen objectives and its ease of
adaptation to different tasks by merely substituting the task guidelines,
without the need for additional complex prompt engineering. Furthermore, when
the user sends a new request, our system is able to replan accordingly with
precision based on the new request, task guidelines and previously executed
steps. Please check more details on our https://wuphilipp.github.io/itp_site
and https://youtu.be/TrKLuyv26_g.