Girando tapas con dos manos
Twisting Lids Off with Two Hands
March 4, 2024
Autores: Toru Lin, Zhao-Heng Yin, Haozhi Qi, Pieter Abbeel, Jitendra Malik
cs.AI
Resumen
La manipulación de objetos con dos manos multifuncionales ha sido un desafío de larga data en robótica, atribuido a la naturaleza rica en contactos de muchas tareas de manipulación y a la complejidad inherente en la coordinación de un sistema bimanual de alta dimensionalidad. En este trabajo, consideramos el problema de girar tapas de diversos objetos similares a botellas con dos manos, y demostramos que las políticas entrenadas en simulación mediante aprendizaje por refuerzo profundo pueden transferirse efectivamente al mundo real. Con nuevas ideas de ingeniería en modelado físico, percepción en tiempo real y diseño de recompensas, la política demuestra capacidades de generalización en un conjunto diverso de objetos no vistos, mostrando comportamientos dinámicos y diestros. Nuestros hallazgos sirven como evidencia convincente de que el aprendizaje por refuerzo profundo combinado con la transferencia sim-to-real sigue siendo un enfoque prometedor para abordar problemas de manipulación de una complejidad sin precedentes.
English
Manipulating objects with two multi-fingered hands has been a long-standing
challenge in robotics, attributed to the contact-rich nature of many
manipulation tasks and the complexity inherent in coordinating a
high-dimensional bimanual system. In this work, we consider the problem of
twisting lids of various bottle-like objects with two hands, and demonstrate
that policies trained in simulation using deep reinforcement learning can be
effectively transferred to the real world. With novel engineering insights into
physical modeling, real-time perception, and reward design, the policy
demonstrates generalization capabilities across a diverse set of unseen
objects, showcasing dynamic and dexterous behaviors. Our findings serve as
compelling evidence that deep reinforcement learning combined with sim-to-real
transfer remains a promising approach for addressing manipulation problems of
unprecedented complexity.