RoboGen: 生成シミュレーションによる自動化ロボット学習のための無限データ解放に向けて
RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation
November 2, 2023
著者: Yufei Wang, Zhou Xian, Feng Chen, Tsun-Hsuan Wang, Yian Wang, Katerina Fragkiadaki, Zackory Erickson, David Held, Chuang Gan
cs.AI
要旨
我々はRoboGenを紹介する。これは生成シミュレーションを通じて大規模に多様なロボットスキルを自動学習する生成型ロボットエージェントである。RoboGenは、基盤モデルと生成モデルの最新の進歩を活用している。これらのモデルを直接使用したり、ポリシーや低レベルのアクションを生成するために適応させるのではなく、我々は生成スキームを提唱する。このスキームでは、これらのモデルを使用して多様なタスク、シーン、およびトレーニングの監督を自動生成し、最小限の人間の監督でロボットスキル学習をスケールアップする。我々のアプローチは、ロボットエージェントに自己誘導型の提案-生成-学習サイクルを装備する。エージェントはまず、開発する興味深いタスクとスキルを提案し、次に関連するオブジェクトとアセットを適切な空間構成で配置して対応するシミュレーション環境を生成する。その後、エージェントは提案された高レベルのタスクをサブタスクに分解し、最適な学習アプローチ(強化学習、モーションプランニング、または軌道最適化)を選択し、必要なトレーニング監督を生成し、提案されたスキルを習得するためのポリシーを学習する。我々の研究は、大規模モデルに埋め込まれた広範で多用途な知識を抽出し、それをロボティクスの分野に転移しようとする試みである。我々の完全生成型パイプラインは繰り返しクエリ可能で、多様なタスクと環境に関連するスキルデモンストレーションの無限のストリームを生成する。
English
We present RoboGen, a generative robotic agent that automatically learns
diverse robotic skills at scale via generative simulation. RoboGen leverages
the latest advancements in foundation and generative models. Instead of
directly using or adapting these models to produce policies or low-level
actions, we advocate for a generative scheme, which uses these models to
automatically generate diversified tasks, scenes, and training supervisions,
thereby scaling up robotic skill learning with minimal human supervision. Our
approach equips a robotic agent with a self-guided propose-generate-learn
cycle: the agent first proposes interesting tasks and skills to develop, and
then generates corresponding simulation environments by populating pertinent
objects and assets with proper spatial configurations. Afterwards, the agent
decomposes the proposed high-level task into sub-tasks, selects the optimal
learning approach (reinforcement learning, motion planning, or trajectory
optimization), generates required training supervision, and then learns
policies to acquire the proposed skill. Our work attempts to extract the
extensive and versatile knowledge embedded in large-scale models and transfer
them to the field of robotics. Our fully generative pipeline can be queried
repeatedly, producing an endless stream of skill demonstrations associated with
diverse tasks and environments.