ChatPaper.aiChatPaper

Voyager: Ein offener verkörperter Agent mit großen Sprachmodellen

Voyager: An Open-Ended Embodied Agent with Large Language Models

May 25, 2023
Autoren: Guanzhi Wang, Yuqi Xie, Yunfan Jiang, Ajay Mandlekar, Chaowei Xiao, Yuke Zhu, Linxi Fan, Anima Anandkumar
cs.AI

Zusammenfassung

Wir stellen Voyager vor, den ersten LLM-basierten verkörperten lebenslang lernenden Agenten in Minecraft, der kontinuierlich die Welt erkundet, vielfältige Fähigkeiten erwirbt und neue Entdeckungen ohne menschliches Eingreifen macht. Voyager besteht aus drei Schlüsselkomponenten: 1) einem automatischen Lehrplan, der die Erkundung maximiert, 2) einer ständig wachsenden Fähigkeitsbibliothek ausführbaren Codes zur Speicherung und Abfrage komplexer Verhaltensweisen und 3) einem neuen iterativen Prompting-Mechanismus, der Umgebungsfeedback, Ausführungsfehler und Selbstverifikation zur Programmverbesserung einbezieht. Voyager interagiert mit GPT-4 über Blackbox-Abfragen, wodurch die Notwendigkeit einer Feinabstimmung der Modellparameter entfällt. Die von Voyager entwickelten Fähigkeiten sind zeitlich erweitert, interpretierbar und kompositionell, was die Fähigkeiten des Agenten schnell steigert und katastrophales Vergessen mildert. Empirisch zeigt Voyager eine starke lebenslange Lernfähigkeit im Kontext und eine außergewöhnliche Kompetenz im Spielen von Minecraft. Es erhält 3,3x mehr einzigartige Gegenstände, legt 2,3x längere Strecken zurück und schaltet Schlüsseltechnologie-Meilensteine bis zu 15,3x schneller frei als bisherige SOTA-Methoden. Voyager ist in der Lage, die gelernte Fähigkeitsbibliothek in einer neuen Minecraft-Welt zu nutzen, um neue Aufgaben von Grund auf zu lösen, während andere Techniken Schwierigkeiten haben, zu generalisieren. Wir stellen unseren vollständigen Code und die Prompts unter https://voyager.minedojo.org/ als Open Source zur Verfügung.
English
We introduce Voyager, the first LLM-powered embodied lifelong learning agent in Minecraft that continuously explores the world, acquires diverse skills, and makes novel discoveries without human intervention. Voyager consists of three key components: 1) an automatic curriculum that maximizes exploration, 2) an ever-growing skill library of executable code for storing and retrieving complex behaviors, and 3) a new iterative prompting mechanism that incorporates environment feedback, execution errors, and self-verification for program improvement. Voyager interacts with GPT-4 via blackbox queries, which bypasses the need for model parameter fine-tuning. The skills developed by Voyager are temporally extended, interpretable, and compositional, which compounds the agent's abilities rapidly and alleviates catastrophic forgetting. Empirically, Voyager shows strong in-context lifelong learning capability and exhibits exceptional proficiency in playing Minecraft. It obtains 3.3x more unique items, travels 2.3x longer distances, and unlocks key tech tree milestones up to 15.3x faster than prior SOTA. Voyager is able to utilize the learned skill library in a new Minecraft world to solve novel tasks from scratch, while other techniques struggle to generalize. We open-source our full codebase and prompts at https://voyager.minedojo.org/.
PDF104December 15, 2024