ChatPaper.aiChatPaper

Voyager: Un agente encarnado de propósito abierto con modelos de lenguaje a gran escala

Voyager: An Open-Ended Embodied Agent with Large Language Models

May 25, 2023
Autores: Guanzhi Wang, Yuqi Xie, Yunfan Jiang, Ajay Mandlekar, Chaowei Xiao, Yuke Zhu, Linxi Fan, Anima Anandkumar
cs.AI

Resumen

Presentamos Voyager, el primer agente de aprendizaje continuo encarnado impulsado por un LLM en Minecraft que explora el mundo de manera continua, adquiere diversas habilidades y realiza descubrimientos novedosos sin intervención humana. Voyager consta de tres componentes clave: 1) un plan de estudios automático que maximiza la exploración, 2) una biblioteca de habilidades en constante crecimiento que almacena y recupera comportamientos complejos en forma de código ejecutable, y 3) un nuevo mecanismo de prompting iterativo que incorpora retroalimentación del entorno, errores de ejecución y autoverificación para mejorar los programas. Voyager interactúa con GPT-4 mediante consultas de caja negra, lo que elimina la necesidad de ajustar los parámetros del modelo. Las habilidades desarrolladas por Voyager son temporalmente extendidas, interpretables y composicionales, lo que acelera rápidamente las capacidades del agente y mitiga el olvido catastrófico. Empíricamente, Voyager demuestra una fuerte capacidad de aprendizaje continuo en contexto y exhibe un dominio excepcional en la jugabilidad de Minecraft. Obtiene 3.3 veces más objetos únicos, recorre distancias 2.3 veces más largas y desbloquea hitos clave del árbol tecnológico hasta 15.3 veces más rápido que los métodos anteriores de última generación. Voyager es capaz de utilizar la biblioteca de habilidades aprendidas en un nuevo mundo de Minecraft para resolver tareas novedosas desde cero, mientras que otras técnicas tienen dificultades para generalizar. Hemos liberado nuestro código completo y los prompts en https://voyager.minedojo.org/.
English
We introduce Voyager, the first LLM-powered embodied lifelong learning agent in Minecraft that continuously explores the world, acquires diverse skills, and makes novel discoveries without human intervention. Voyager consists of three key components: 1) an automatic curriculum that maximizes exploration, 2) an ever-growing skill library of executable code for storing and retrieving complex behaviors, and 3) a new iterative prompting mechanism that incorporates environment feedback, execution errors, and self-verification for program improvement. Voyager interacts with GPT-4 via blackbox queries, which bypasses the need for model parameter fine-tuning. The skills developed by Voyager are temporally extended, interpretable, and compositional, which compounds the agent's abilities rapidly and alleviates catastrophic forgetting. Empirically, Voyager shows strong in-context lifelong learning capability and exhibits exceptional proficiency in playing Minecraft. It obtains 3.3x more unique items, travels 2.3x longer distances, and unlocks key tech tree milestones up to 15.3x faster than prior SOTA. Voyager is able to utilize the learned skill library in a new Minecraft world to solve novel tasks from scratch, while other techniques struggle to generalize. We open-source our full codebase and prompts at https://voyager.minedojo.org/.
PDF104December 15, 2024