MyoDex: Универсальный априор для ловкого манипулирования
MyoDex: A Generalizable Prior for Dexterous Manipulation
September 6, 2023
Авторы: Vittorio Caggiano, Sudeep Dasari, Vikash Kumar
cs.AI
Аннотация
Ловкость человека является отличительной чертой моторного контроля. Наши руки способны быстро синтезировать новые поведенческие паттерны, несмотря на сложность (многосуставность и многозвенность, с 23 суставами, управляемыми более чем 40 мышцами) сенсомоторных цепей опорно-двигательного аппарата. В данной работе мы вдохновляемся тем, как человеческая ловкость основывается на разнообразии предыдущего опыта, а не приобретается через выполнение одной задачи. Мотивированные этим наблюдением, мы стремимся разработать агентов, которые могут опираться на свой предыдущий опыт для быстрого освоения новых (ранее недоступных) поведенческих паттернов. В частности, наш подход использует многозадачное обучение для неявного захвата априорных знаний о поведении, не зависящих от задачи (MyoDex), для достижения человеческой ловкости, используя физиологически реалистичную модель человеческой руки — MyoHand. Мы демонстрируем эффективность MyoDex в обобщении с малым количеством примеров, а также положительный перенос на большое количество ранее неизвестных задач ловкого манипулирования. Агенты, использующие MyoDex, могут решать примерно в 3 раза больше задач и в 4 раза быстрее по сравнению с базовым подходом, основанным на дистилляции. В то время как предыдущие работы синтезировали отдельные поведенческие паттерны управления опорно-двигательным аппаратом, MyoDex представляет собой первый обобщаемый априорный подход, который ускоряет обучение физиологическому управлению ловкостью в широком спектре задач, связанных с интенсивным контактом. Мы также демонстрируем эффективность наших подходов за пределами управления опорно-двигательным аппаратом, в направлении освоения ловкости в 24-степенном манипуляторе Adroit Hand. Веб-сайт: https://sites.google.com/view/myodex
English
Human dexterity is a hallmark of motor control. Our hands can rapidly
synthesize new behaviors despite the complexity (multi-articular and
multi-joints, with 23 joints controlled by more than 40 muscles) of
musculoskeletal sensory-motor circuits. In this work, we take inspiration from
how human dexterity builds on a diversity of prior experiences, instead of
being acquired through a single task. Motivated by this observation, we set out
to develop agents that can build upon their previous experience to quickly
acquire new (previously unattainable) behaviors. Specifically, our approach
leverages multi-task learning to implicitly capture task-agnostic behavioral
priors (MyoDex) for human-like dexterity, using a physiologically realistic
human hand model - MyoHand. We demonstrate MyoDex's effectiveness in few-shot
generalization as well as positive transfer to a large repertoire of unseen
dexterous manipulation tasks. Agents leveraging MyoDex can solve approximately
3x more tasks, and 4x faster in comparison to a distillation baseline. While
prior work has synthesized single musculoskeletal control behaviors, MyoDex is
the first generalizable manipulation prior that catalyzes the learning of
dexterous physiological control across a large variety of contact-rich
behaviors. We also demonstrate the effectiveness of our paradigms beyond
musculoskeletal control towards the acquisition of dexterity in 24 DoF Adroit
Hand. Website: https://sites.google.com/view/myodex