Planificación de Tareas Interactivas con Modelos de Lenguaje
Interactive Task Planning with Language Models
October 16, 2023
Autores: Boyi Li, Philipp Wu, Pieter Abbeel, Jitendra Malik
cs.AI
Resumen
Un marco de trabajo robótico interactivo logra la planificación de tareas a largo plazo y puede generalizarse fácilmente a nuevos objetivos o tareas distintas, incluso durante la ejecución. Sin embargo, la mayoría de los métodos tradicionales requieren un diseño de módulos predefinido, lo que dificulta la generalización a diferentes objetivos. Los enfoques recientes basados en modelos de lenguaje de gran escala permiten una planificación más abierta, pero a menudo requieren una ingeniería de prompts compleja o modelos preentrenados específicos de dominio. Para abordar esto, proponemos un marco simple que logra la planificación interactiva de tareas utilizando modelos de lenguaje. Nuestro sistema incorpora tanto la planificación de alto nivel como la ejecución de funciones de bajo nivel a través del lenguaje. Verificamos la robustez de nuestro sistema en la generación de instrucciones de alto nivel novedosas para objetivos no vistos y su facilidad de adaptación a diferentes tareas simplemente sustituyendo las directrices de la tarea, sin necesidad de ingeniería de prompts adicional compleja. Además, cuando el usuario envía una nueva solicitud, nuestro sistema es capaz de replanificar con precisión en función de la nueva solicitud, las directrices de la tarea y los pasos previamente ejecutados. Para más detalles, consulte https://wuphilipp.github.io/itp_site y https://youtu.be/TrKLuyv26_g.
English
An interactive robot framework accomplishes long-horizon task planning and
can easily generalize to new goals or distinct tasks, even during execution.
However, most traditional methods require predefined module design, which makes
it hard to generalize to different goals. Recent large language model based
approaches can allow for more open-ended planning but often require heavy
prompt engineering or domain-specific pretrained models. To tackle this, we
propose a simple framework that achieves interactive task planning with
language models. Our system incorporates both high-level planning and low-level
function execution via language. We verify the robustness of our system in
generating novel high-level instructions for unseen objectives and its ease of
adaptation to different tasks by merely substituting the task guidelines,
without the need for additional complex prompt engineering. Furthermore, when
the user sends a new request, our system is able to replan accordingly with
precision based on the new request, task guidelines and previously executed
steps. Please check more details on our https://wuphilipp.github.io/itp_site
and https://youtu.be/TrKLuyv26_g.