ChatPaper.aiChatPaper

Voyager: Een Open-Ended Belichaamde Agent met Grote Taalmodellen

Voyager: An Open-Ended Embodied Agent with Large Language Models

May 25, 2023
Auteurs: Guanzhi Wang, Yuqi Xie, Yunfan Jiang, Ajay Mandlekar, Chaowei Xiao, Yuke Zhu, Linxi Fan, Anima Anandkumar
cs.AI

Samenvatting

We introduceren Voyager, de eerste LLM-gestuurde belichaamde levenslange leeragent in Minecraft die continu de wereld verkent, diverse vaardigheden verwerft en nieuwe ontdekkingen doet zonder menselijke tussenkomst. Voyager bestaat uit drie belangrijke componenten: 1) een automatisch curriculum dat exploratie maximaliseert, 2) een steeds groeiende vaardigheidsbibliotheek van uitvoerbare code voor het opslaan en ophalen van complexe gedragingen, en 3) een nieuw iteratief promptmechanisme dat omgevingsfeedback, uitvoeringsfouten en zelfverificatie integreert voor programmaverbetering. Voyager interageert met GPT-4 via blackbox-query's, waardoor het afstemmen van modelparameters overbodig wordt. De vaardigheden die Voyager ontwikkelt, zijn tijdelijk uitgebreid, interpreteerbaar en compositioneel, wat de mogelijkheden van de agent snel vergroot en catastrofaal vergeten vermindert. Empirisch toont Voyager een sterke levenslange leerbaarheid in context en vertoont het uitzonderlijke vaardigheid in het spelen van Minecraft. Het verkrijgt 3,3x meer unieke items, legt 2,3x langere afstanden af en ontgrendelt belangrijke technologietak-mijlpalen tot 15,3x sneller dan eerdere state-of-the-art methoden. Voyager is in staat om de geleerde vaardigheidsbibliotheek te gebruiken in een nieuwe Minecraft-wereld om nieuwe taken vanaf nul op te lossen, terwijl andere technieken moeite hebben met generaliseren. We maken onze volledige codebase en prompts openbaar op https://voyager.minedojo.org/.
English
We introduce Voyager, the first LLM-powered embodied lifelong learning agent in Minecraft that continuously explores the world, acquires diverse skills, and makes novel discoveries without human intervention. Voyager consists of three key components: 1) an automatic curriculum that maximizes exploration, 2) an ever-growing skill library of executable code for storing and retrieving complex behaviors, and 3) a new iterative prompting mechanism that incorporates environment feedback, execution errors, and self-verification for program improvement. Voyager interacts with GPT-4 via blackbox queries, which bypasses the need for model parameter fine-tuning. The skills developed by Voyager are temporally extended, interpretable, and compositional, which compounds the agent's abilities rapidly and alleviates catastrophic forgetting. Empirically, Voyager shows strong in-context lifelong learning capability and exhibits exceptional proficiency in playing Minecraft. It obtains 3.3x more unique items, travels 2.3x longer distances, and unlocks key tech tree milestones up to 15.3x faster than prior SOTA. Voyager is able to utilize the learned skill library in a new Minecraft world to solve novel tasks from scratch, while other techniques struggle to generalize. We open-source our full codebase and prompts at https://voyager.minedojo.org/.
PDF114December 15, 2024