MyoDex: Универсальный априор для ловкого манипулирования

Аннотация

Ловкость человека является отличительной чертой моторного контроля. Наши руки способны быстро синтезировать новые поведенческие паттерны, несмотря на сложность (многосуставность и многозвенность, с 23 суставами, управляемыми более чем 40 мышцами) сенсомоторных цепей опорно-двигательного аппарата. В данной работе мы вдохновляемся тем, как человеческая ловкость основывается на разнообразии предыдущего опыта, а не приобретается через выполнение одной задачи. Мотивированные этим наблюдением, мы стремимся разработать агентов, которые могут опираться на свой предыдущий опыт для быстрого освоения новых (ранее недоступных) поведенческих паттернов. В частности, наш подход использует многозадачное обучение для неявного захвата априорных знаний о поведении, не зависящих от задачи (MyoDex), для достижения человеческой ловкости, используя физиологически реалистичную модель человеческой руки — MyoHand. Мы демонстрируем эффективность MyoDex в обобщении с малым количеством примеров, а также положительный перенос на большое количество ранее неизвестных задач ловкого манипулирования. Агенты, использующие MyoDex, могут решать примерно в 3 раза больше задач и в 4 раза быстрее по сравнению с базовым подходом, основанным на дистилляции. В то время как предыдущие работы синтезировали отдельные поведенческие паттерны управления опорно-двигательным аппаратом, MyoDex представляет собой первый обобщаемый априорный подход, который ускоряет обучение физиологическому управлению ловкостью в широком спектре задач, связанных с интенсивным контактом. Мы также демонстрируем эффективность наших подходов за пределами управления опорно-двигательным аппаратом, в направлении освоения ловкости в 24-степенном манипуляторе Adroit Hand. Веб-сайт: https://sites.google.com/view/myodex

English

Human dexterity is a hallmark of motor control. Our hands can rapidly synthesize new behaviors despite the complexity (multi-articular and multi-joints, with 23 joints controlled by more than 40 muscles) of musculoskeletal sensory-motor circuits. In this work, we take inspiration from how human dexterity builds on a diversity of prior experiences, instead of being acquired through a single task. Motivated by this observation, we set out to develop agents that can build upon their previous experience to quickly acquire new (previously unattainable) behaviors. Specifically, our approach leverages multi-task learning to implicitly capture task-agnostic behavioral priors (MyoDex) for human-like dexterity, using a physiologically realistic human hand model - MyoHand. We demonstrate MyoDex's effectiveness in few-shot generalization as well as positive transfer to a large repertoire of unseen dexterous manipulation tasks. Agents leveraging MyoDex can solve approximately 3x more tasks, and 4x faster in comparison to a distillation baseline. While prior work has synthesized single musculoskeletal control behaviors, MyoDex is the first generalizable manipulation prior that catalyzes the learning of dexterous physiological control across a large variety of contact-rich behaviors. We also demonstrate the effectiveness of our paradigms beyond musculoskeletal control towards the acquisition of dexterity in 24 DoF Adroit Hand. Website: https://sites.google.com/view/myodex

MyoDex: Универсальный априор для ловкого манипулирования

MyoDex: A Generalizable Prior for Dexterous Manipulation

Аннотация

Support