Voyager: 大規模言語モデルを搭載したオープンエンド型エンボディエージェント
Voyager: An Open-Ended Embodied Agent with Large Language Models
May 25, 2023
著者: Guanzhi Wang, Yuqi Xie, Yunfan Jiang, Ajay Mandlekar, Chaowei Xiao, Yuke Zhu, Linxi Fan, Anima Anandkumar
cs.AI
要旨
私たちは、Minecraft内で世界を継続的に探索し、多様なスキルを獲得し、人間の介入なしに新たな発見を行う、初のLLM駆動型具身生涯学習エージェント「Voyager」を紹介します。Voyagerは以下の3つの主要コンポーネントで構成されています:1) 探索を最大化する自動カリキュラム、2) 複雑な行動を保存・検索するための実行可能なコードからなる常に成長するスキルライブラリ、3) 環境フィードバック、実行エラー、自己検証を取り入れた新しい反復的プロンプティングメカニズムです。VoyagerはGPT-4とブラックボックスクエリを介して相互作用し、モデルパラメータの微調整を必要としません。Voyagerによって開発されたスキルは、時間的に拡張可能で、解釈可能であり、構成可能であるため、エージェントの能力が急速に向上し、破滅的忘却を軽減します。実験的に、Voyagerは強力な文脈内生涯学習能力を示し、Minecraftのプレイにおいて卓越した熟練度を発揮します。Voyagerは、従来のSOTAと比較して、3.3倍のユニークアイテムを獲得し、2.3倍の長距離を移動し、主要なテックツリーマイルストーンを最大15.3倍速く解除します。Voyagerは、学習したスキルライブラリを新しいMinecraftワールドで活用し、ゼロから新たなタスクを解決することができますが、他の技術は一般化に苦労します。私たちは、完全なコードベースとプロンプトをhttps://voyager.minedojo.org/でオープンソースとして公開しています。
English
We introduce Voyager, the first LLM-powered embodied lifelong learning agent
in Minecraft that continuously explores the world, acquires diverse skills, and
makes novel discoveries without human intervention. Voyager consists of three
key components: 1) an automatic curriculum that maximizes exploration, 2) an
ever-growing skill library of executable code for storing and retrieving
complex behaviors, and 3) a new iterative prompting mechanism that incorporates
environment feedback, execution errors, and self-verification for program
improvement. Voyager interacts with GPT-4 via blackbox queries, which bypasses
the need for model parameter fine-tuning. The skills developed by Voyager are
temporally extended, interpretable, and compositional, which compounds the
agent's abilities rapidly and alleviates catastrophic forgetting. Empirically,
Voyager shows strong in-context lifelong learning capability and exhibits
exceptional proficiency in playing Minecraft. It obtains 3.3x more unique
items, travels 2.3x longer distances, and unlocks key tech tree milestones up
to 15.3x faster than prior SOTA. Voyager is able to utilize the learned skill
library in a new Minecraft world to solve novel tasks from scratch, while other
techniques struggle to generalize. We open-source our full codebase and prompts
at https://voyager.minedojo.org/.