MyoDex:器用な操作のための汎用性の高い事前知識
MyoDex: A Generalizable Prior for Dexterous Manipulation
September 6, 2023
著者: Vittorio Caggiano, Sudeep Dasari, Vikash Kumar
cs.AI
要旨
人間の器用さは運動制御の特徴である。私たちの手は、筋骨格感覚運動回路の複雑さ(多関節・多接合、40以上の筋肉によって制御される23の関節)にもかかわらず、新しい行動を迅速に合成することができる。本研究では、人間の器用さが単一のタスクを通じて獲得されるのではなく、多様な過去の経験に基づいて構築されることに着想を得た。この観察に基づき、私たちは以前の経験を基に新しい(以前は達成できなかった)行動を迅速に獲得できるエージェントの開発に着手した。具体的には、生理学的に現実的な人間の手のモデルであるMyoHandを使用して、マルチタスク学習を活用し、人間のような器用さのためのタスクに依存しない行動事前分布(MyoDex)を暗黙的に捕捉するアプローチを採用した。私たちは、MyoDexの数ショットでの一般化能力と、多数の未経験の器用な操作タスクへの正の転移効果を実証した。MyoDexを活用したエージェントは、蒸留ベースラインと比較して約3倍のタスクを解決し、4倍の速さで学習することができる。これまでの研究では単一の筋骨格制御行動を合成してきたが、MyoDexは、多様な接触の多い行動にわたる器用な生理学的制御の学習を促進する最初の一般化可能な操作事前分布である。また、筋骨格制御を超えて、24自由度のAdroit Handにおける器用さの獲得に向けた私たちのパラダイムの有効性も実証した。ウェブサイト: https://sites.google.com/view/myodex
English
Human dexterity is a hallmark of motor control. Our hands can rapidly
synthesize new behaviors despite the complexity (multi-articular and
multi-joints, with 23 joints controlled by more than 40 muscles) of
musculoskeletal sensory-motor circuits. In this work, we take inspiration from
how human dexterity builds on a diversity of prior experiences, instead of
being acquired through a single task. Motivated by this observation, we set out
to develop agents that can build upon their previous experience to quickly
acquire new (previously unattainable) behaviors. Specifically, our approach
leverages multi-task learning to implicitly capture task-agnostic behavioral
priors (MyoDex) for human-like dexterity, using a physiologically realistic
human hand model - MyoHand. We demonstrate MyoDex's effectiveness in few-shot
generalization as well as positive transfer to a large repertoire of unseen
dexterous manipulation tasks. Agents leveraging MyoDex can solve approximately
3x more tasks, and 4x faster in comparison to a distillation baseline. While
prior work has synthesized single musculoskeletal control behaviors, MyoDex is
the first generalizable manipulation prior that catalyzes the learning of
dexterous physiological control across a large variety of contact-rich
behaviors. We also demonstrate the effectiveness of our paradigms beyond
musculoskeletal control towards the acquisition of dexterity in 24 DoF Adroit
Hand. Website: https://sites.google.com/view/myodex