ChatPaper.aiChatPaper

Removendo Tampa com Duas Mãos

Twisting Lids Off with Two Hands

March 4, 2024
Autores: Toru Lin, Zhao-Heng Yin, Haozhi Qi, Pieter Abbeel, Jitendra Malik
cs.AI

Resumo

Manipular objetos com duas mãos multifuncionais tem sido um desafio de longa data na robótica, atribuído à natureza rica em contato de muitas tarefas de manipulação e à complexidade inerente na coordenação de um sistema bimanual de alta dimensionalidade. Neste trabalho, consideramos o problema de girar tampas de diversos objetos semelhantes a garrafas com duas mãos, e demonstramos que políticas treinadas em simulação usando aprendizado por reforço profundo podem ser efetivamente transferidas para o mundo real. Com novas percepções de engenharia em modelagem física, percepção em tempo real e design de recompensas, a política demonstra capacidades de generalização em um conjunto diversificado de objetos não vistos, exibindo comportamentos dinâmicos e habilidosos. Nossas descobertas servem como evidência convincente de que o aprendizado por reforço profundo combinado com transferência sim-para-real continua sendo uma abordagem promissora para resolver problemas de manipulação de complexidade sem precedentes.
English
Manipulating objects with two multi-fingered hands has been a long-standing challenge in robotics, attributed to the contact-rich nature of many manipulation tasks and the complexity inherent in coordinating a high-dimensional bimanual system. In this work, we consider the problem of twisting lids of various bottle-like objects with two hands, and demonstrate that policies trained in simulation using deep reinforcement learning can be effectively transferred to the real world. With novel engineering insights into physical modeling, real-time perception, and reward design, the policy demonstrates generalization capabilities across a diverse set of unseen objects, showcasing dynamic and dexterous behaviors. Our findings serve as compelling evidence that deep reinforcement learning combined with sim-to-real transfer remains a promising approach for addressing manipulation problems of unprecedented complexity.
PDF71December 15, 2024