ChatPaper.aiChatPaper

Pianificazione Interattiva di Compiti con Modelli Linguistici

Interactive Task Planning with Language Models

October 16, 2023
Autori: Boyi Li, Philipp Wu, Pieter Abbeel, Jitendra Malik
cs.AI

Abstract

Un framework robotico interattivo realizza la pianificazione di compiti a lungo termine e può facilmente generalizzare a nuovi obiettivi o compiti distinti, anche durante l'esecuzione. Tuttavia, la maggior parte dei metodi tradizionali richiede una progettazione modulare predefinita, il che rende difficile generalizzare a obiettivi diversi. I recenti approcci basati su modelli linguistici di grandi dimensioni consentono una pianificazione più aperta, ma spesso richiedono un'ingegnerizzazione complessa dei prompt o modelli preaddestrati specifici per dominio. Per affrontare questo problema, proponiamo un framework semplice che realizza la pianificazione interattiva dei compiti utilizzando modelli linguistici. Il nostro sistema incorpora sia la pianificazione di alto livello che l'esecuzione di funzioni di basso livello tramite il linguaggio. Verifichiamo la robustezza del nostro sistema nella generazione di istruzioni di alto livello per obiettivi non visti e la sua facilità di adattamento a compiti diversi semplicemente sostituendo le linee guida del compito, senza la necessità di un'ulteriore complessa ingegnerizzazione dei prompt. Inoltre, quando l'utente invia una nuova richiesta, il nostro sistema è in grado di ripianificare con precisione in base alla nuova richiesta, alle linee guida del compito e ai passaggi precedentemente eseguiti. Per maggiori dettagli, consultate https://wuphilipp.github.io/itp_site e https://youtu.be/TrKLuyv26_g.
English
An interactive robot framework accomplishes long-horizon task planning and can easily generalize to new goals or distinct tasks, even during execution. However, most traditional methods require predefined module design, which makes it hard to generalize to different goals. Recent large language model based approaches can allow for more open-ended planning but often require heavy prompt engineering or domain-specific pretrained models. To tackle this, we propose a simple framework that achieves interactive task planning with language models. Our system incorporates both high-level planning and low-level function execution via language. We verify the robustness of our system in generating novel high-level instructions for unseen objectives and its ease of adaptation to different tasks by merely substituting the task guidelines, without the need for additional complex prompt engineering. Furthermore, when the user sends a new request, our system is able to replan accordingly with precision based on the new request, task guidelines and previously executed steps. Please check more details on our https://wuphilipp.github.io/itp_site and https://youtu.be/TrKLuyv26_g.
PDF131December 14, 2025