MyoDex: Ein generalisierbares Prior für geschickte Manipulation
MyoDex: A Generalizable Prior for Dexterous Manipulation
September 6, 2023
Autoren: Vittorio Caggiano, Sudeep Dasari, Vikash Kumar
cs.AI
Zusammenfassung
Die Geschicklichkeit des Menschen ist ein Markenzeichen der motorischen Kontrolle. Unsere Hände können trotz der Komplexität (multiartikulär und mehrgelenkig, mit 23 Gelenken, die von mehr als 40 Muskeln gesteuert werden) der muskuloskelettalen sensorimotorischen Schaltkreise schnell neue Verhaltensweisen synthetisieren. In dieser Arbeit lassen wir uns davon inspirieren, wie menschliche Geschicklichkeit auf einer Vielzahl von Vorerfahrungen aufbaut, anstatt durch eine einzelne Aufgabe erworben zu werden. Motiviert durch diese Beobachtung haben wir uns zum Ziel gesetzt, Agenten zu entwickeln, die auf ihren bisherigen Erfahrungen aufbauen können, um schnell neue (zuvor unerreichbare) Verhaltensweisen zu erlernen. Konkret nutzt unser Ansatz Multi-Task-Learning, um implizit aufgabenunabhängige Verhaltenspriors (MyoDex) für menschenähnliche Geschicklichkeit zu erfassen, wobei ein physiologisch realistisches Modell der menschlichen Hand – MyoHand – verwendet wird. Wir demonstrieren die Wirksamkeit von MyoDex in der Few-Shot-Generalisierung sowie den positiven Transfer auf eine große Anzahl von unbekannten geschickten Manipulationsaufgaben. Agenten, die MyoDex nutzen, können etwa dreimal mehr Aufgaben lösen und dies viermal schneller im Vergleich zu einem Distillations-Baseline. Während frühere Arbeiten einzelne muskuloskelettale Kontrollverhaltensweisen synthetisiert haben, ist MyoDex der erste generalisierbare Manipulationsprior, der das Lernen geschickter physiologischer Kontrolle über eine große Vielfalt von kontaktreichen Verhaltensweisen katalysiert. Wir zeigen auch die Wirksamkeit unserer Paradigmen über die muskuloskelettale Kontrolle hinaus bei der Erlangung von Geschicklichkeit in der 24-DoF-Adroit-Hand. Website: https://sites.google.com/view/myodex
English
Human dexterity is a hallmark of motor control. Our hands can rapidly
synthesize new behaviors despite the complexity (multi-articular and
multi-joints, with 23 joints controlled by more than 40 muscles) of
musculoskeletal sensory-motor circuits. In this work, we take inspiration from
how human dexterity builds on a diversity of prior experiences, instead of
being acquired through a single task. Motivated by this observation, we set out
to develop agents that can build upon their previous experience to quickly
acquire new (previously unattainable) behaviors. Specifically, our approach
leverages multi-task learning to implicitly capture task-agnostic behavioral
priors (MyoDex) for human-like dexterity, using a physiologically realistic
human hand model - MyoHand. We demonstrate MyoDex's effectiveness in few-shot
generalization as well as positive transfer to a large repertoire of unseen
dexterous manipulation tasks. Agents leveraging MyoDex can solve approximately
3x more tasks, and 4x faster in comparison to a distillation baseline. While
prior work has synthesized single musculoskeletal control behaviors, MyoDex is
the first generalizable manipulation prior that catalyzes the learning of
dexterous physiological control across a large variety of contact-rich
behaviors. We also demonstrate the effectiveness of our paradigms beyond
musculoskeletal control towards the acquisition of dexterity in 24 DoF Adroit
Hand. Website: https://sites.google.com/view/myodex