Pianificazione Interattiva di Compiti con Modelli Linguistici
Interactive Task Planning with Language Models
October 16, 2023
Autori: Boyi Li, Philipp Wu, Pieter Abbeel, Jitendra Malik
cs.AI
Abstract
Un framework robotico interattivo realizza la pianificazione di compiti a lungo termine e può facilmente generalizzare a nuovi obiettivi o compiti distinti, anche durante l'esecuzione. Tuttavia, la maggior parte dei metodi tradizionali richiede una progettazione modulare predefinita, il che rende difficile generalizzare a obiettivi diversi. I recenti approcci basati su modelli linguistici di grandi dimensioni consentono una pianificazione più aperta, ma spesso richiedono un'ingegnerizzazione complessa dei prompt o modelli preaddestrati specifici per dominio. Per affrontare questo problema, proponiamo un framework semplice che realizza la pianificazione interattiva dei compiti utilizzando modelli linguistici. Il nostro sistema incorpora sia la pianificazione di alto livello che l'esecuzione di funzioni di basso livello tramite il linguaggio. Verifichiamo la robustezza del nostro sistema nella generazione di istruzioni di alto livello per obiettivi non visti e la sua facilità di adattamento a compiti diversi semplicemente sostituendo le linee guida del compito, senza la necessità di un'ulteriore complessa ingegnerizzazione dei prompt. Inoltre, quando l'utente invia una nuova richiesta, il nostro sistema è in grado di ripianificare con precisione in base alla nuova richiesta, alle linee guida del compito e ai passaggi precedentemente eseguiti. Per maggiori dettagli, consultate https://wuphilipp.github.io/itp_site e https://youtu.be/TrKLuyv26_g.
English
An interactive robot framework accomplishes long-horizon task planning and
can easily generalize to new goals or distinct tasks, even during execution.
However, most traditional methods require predefined module design, which makes
it hard to generalize to different goals. Recent large language model based
approaches can allow for more open-ended planning but often require heavy
prompt engineering or domain-specific pretrained models. To tackle this, we
propose a simple framework that achieves interactive task planning with
language models. Our system incorporates both high-level planning and low-level
function execution via language. We verify the robustness of our system in
generating novel high-level instructions for unseen objectives and its ease of
adaptation to different tasks by merely substituting the task guidelines,
without the need for additional complex prompt engineering. Furthermore, when
the user sends a new request, our system is able to replan accordingly with
precision based on the new request, task guidelines and previously executed
steps. Please check more details on our https://wuphilipp.github.io/itp_site
and https://youtu.be/TrKLuyv26_g.