Removendo Tampa com Duas Mãos
Twisting Lids Off with Two Hands
March 4, 2024
Autores: Toru Lin, Zhao-Heng Yin, Haozhi Qi, Pieter Abbeel, Jitendra Malik
cs.AI
Resumo
Manipular objetos com duas mãos multifuncionais tem sido um desafio de longa data na robótica, atribuído à natureza rica em contato de muitas tarefas de manipulação e à complexidade inerente na coordenação de um sistema bimanual de alta dimensionalidade. Neste trabalho, consideramos o problema de girar tampas de diversos objetos semelhantes a garrafas com duas mãos, e demonstramos que políticas treinadas em simulação usando aprendizado por reforço profundo podem ser efetivamente transferidas para o mundo real. Com novas percepções de engenharia em modelagem física, percepção em tempo real e design de recompensas, a política demonstra capacidades de generalização em um conjunto diversificado de objetos não vistos, exibindo comportamentos dinâmicos e habilidosos. Nossas descobertas servem como evidência convincente de que o aprendizado por reforço profundo combinado com transferência sim-para-real continua sendo uma abordagem promissora para resolver problemas de manipulação de complexidade sem precedentes.
English
Manipulating objects with two multi-fingered hands has been a long-standing
challenge in robotics, attributed to the contact-rich nature of many
manipulation tasks and the complexity inherent in coordinating a
high-dimensional bimanual system. In this work, we consider the problem of
twisting lids of various bottle-like objects with two hands, and demonstrate
that policies trained in simulation using deep reinforcement learning can be
effectively transferred to the real world. With novel engineering insights into
physical modeling, real-time perception, and reward design, the policy
demonstrates generalization capabilities across a diverse set of unseen
objects, showcasing dynamic and dexterous behaviors. Our findings serve as
compelling evidence that deep reinforcement learning combined with sim-to-real
transfer remains a promising approach for addressing manipulation problems of
unprecedented complexity.