MyoDex: Ein generalisierbares Prior für geschickte Manipulation

papers.abstract

Die Geschicklichkeit des Menschen ist ein Markenzeichen der motorischen Kontrolle. Unsere Hände können trotz der Komplexität (multiartikulär und mehrgelenkig, mit 23 Gelenken, die von mehr als 40 Muskeln gesteuert werden) der muskuloskelettalen sensorimotorischen Schaltkreise schnell neue Verhaltensweisen synthetisieren. In dieser Arbeit lassen wir uns davon inspirieren, wie menschliche Geschicklichkeit auf einer Vielzahl von Vorerfahrungen aufbaut, anstatt durch eine einzelne Aufgabe erworben zu werden. Motiviert durch diese Beobachtung haben wir uns zum Ziel gesetzt, Agenten zu entwickeln, die auf ihren bisherigen Erfahrungen aufbauen können, um schnell neue (zuvor unerreichbare) Verhaltensweisen zu erlernen. Konkret nutzt unser Ansatz Multi-Task-Learning, um implizit aufgabenunabhängige Verhaltenspriors (MyoDex) für menschenähnliche Geschicklichkeit zu erfassen, wobei ein physiologisch realistisches Modell der menschlichen Hand – MyoHand – verwendet wird. Wir demonstrieren die Wirksamkeit von MyoDex in der Few-Shot-Generalisierung sowie den positiven Transfer auf eine große Anzahl von unbekannten geschickten Manipulationsaufgaben. Agenten, die MyoDex nutzen, können etwa dreimal mehr Aufgaben lösen und dies viermal schneller im Vergleich zu einem Distillations-Baseline. Während frühere Arbeiten einzelne muskuloskelettale Kontrollverhaltensweisen synthetisiert haben, ist MyoDex der erste generalisierbare Manipulationsprior, der das Lernen geschickter physiologischer Kontrolle über eine große Vielfalt von kontaktreichen Verhaltensweisen katalysiert. Wir zeigen auch die Wirksamkeit unserer Paradigmen über die muskuloskelettale Kontrolle hinaus bei der Erlangung von Geschicklichkeit in der 24-DoF-Adroit-Hand. Website: https://sites.google.com/view/myodex

English

Human dexterity is a hallmark of motor control. Our hands can rapidly synthesize new behaviors despite the complexity (multi-articular and multi-joints, with 23 joints controlled by more than 40 muscles) of musculoskeletal sensory-motor circuits. In this work, we take inspiration from how human dexterity builds on a diversity of prior experiences, instead of being acquired through a single task. Motivated by this observation, we set out to develop agents that can build upon their previous experience to quickly acquire new (previously unattainable) behaviors. Specifically, our approach leverages multi-task learning to implicitly capture task-agnostic behavioral priors (MyoDex) for human-like dexterity, using a physiologically realistic human hand model - MyoHand. We demonstrate MyoDex's effectiveness in few-shot generalization as well as positive transfer to a large repertoire of unseen dexterous manipulation tasks. Agents leveraging MyoDex can solve approximately 3x more tasks, and 4x faster in comparison to a distillation baseline. While prior work has synthesized single musculoskeletal control behaviors, MyoDex is the first generalizable manipulation prior that catalyzes the learning of dexterous physiological control across a large variety of contact-rich behaviors. We also demonstrate the effectiveness of our paradigms beyond musculoskeletal control towards the acquisition of dexterity in 24 DoF Adroit Hand. Website: https://sites.google.com/view/myodex

MyoDex: Ein generalisierbares Prior für geschickte Manipulation

MyoDex: A Generalizable Prior for Dexterous Manipulation

papers.abstract

Support