ChatPaper.aiChatPaper

Voyager: Un Agente Embodiment Open-Ended con Modelli Linguistici di Grande Scala

Voyager: An Open-Ended Embodied Agent with Large Language Models

May 25, 2023
Autori: Guanzhi Wang, Yuqi Xie, Yunfan Jiang, Ajay Mandlekar, Chaowei Xiao, Yuke Zhu, Linxi Fan, Anima Anandkumar
cs.AI

Abstract

Presentiamo Voyager, il primo agente di apprendimento permanente incarnato e alimentato da LLM in Minecraft che esplora continuamente il mondo, acquisisce abilità diverse e fa nuove scoperte senza intervento umano. Voyager è composto da tre componenti chiave: 1) un curriculum automatico che massimizza l'esplorazione, 2) una biblioteca di abilità in continua crescita contenente codice eseguibile per memorizzare e recuperare comportamenti complessi, e 3) un nuovo meccanismo di prompting iterativo che incorpora feedback ambientali, errori di esecuzione e auto-verifica per il miglioramento dei programmi. Voyager interagisce con GPT-4 tramite query in modalità blackbox, evitando la necessità di fine-tuning dei parametri del modello. Le abilità sviluppate da Voyager sono temporalmente estese, interpretabili e composizionali, il che amplifica rapidamente le capacità dell'agente e mitiga il problema della dimenticanza catastrofica. Empiricamente, Voyager dimostra una forte capacità di apprendimento permanente in contesto e mostra un'eccezionale competenza nel giocare a Minecraft. Ottiene 3,3 volte più oggetti unici, percorre distanze 2,3 volte più lunghe e sblocca i principali traguardi dell'albero tecnologico fino a 15,3 volte più velocemente rispetto ai precedenti SOTA. Voyager è in grado di utilizzare la biblioteca di abilità apprese in un nuovo mondo di Minecraft per risolvere compiti nuovi da zero, mentre altre tecniche faticano a generalizzare. Abbiamo reso open-source il nostro codice completo e i prompt all'indirizzo https://voyager.minedojo.org/.
English
We introduce Voyager, the first LLM-powered embodied lifelong learning agent in Minecraft that continuously explores the world, acquires diverse skills, and makes novel discoveries without human intervention. Voyager consists of three key components: 1) an automatic curriculum that maximizes exploration, 2) an ever-growing skill library of executable code for storing and retrieving complex behaviors, and 3) a new iterative prompting mechanism that incorporates environment feedback, execution errors, and self-verification for program improvement. Voyager interacts with GPT-4 via blackbox queries, which bypasses the need for model parameter fine-tuning. The skills developed by Voyager are temporally extended, interpretable, and compositional, which compounds the agent's abilities rapidly and alleviates catastrophic forgetting. Empirically, Voyager shows strong in-context lifelong learning capability and exhibits exceptional proficiency in playing Minecraft. It obtains 3.3x more unique items, travels 2.3x longer distances, and unlocks key tech tree milestones up to 15.3x faster than prior SOTA. Voyager is able to utilize the learned skill library in a new Minecraft world to solve novel tasks from scratch, while other techniques struggle to generalize. We open-source our full codebase and prompts at https://voyager.minedojo.org/.
PDF114December 15, 2024