Rimuovere i tappi con torsione utilizzando due mani
Twisting Lids Off with Two Hands
March 4, 2024
Autori: Toru Lin, Zhao-Heng Yin, Haozhi Qi, Pieter Abbeel, Jitendra Malik
cs.AI
Abstract
La manipolazione di oggetti con due mani multi-dita è stata una sfida di lunga data nella robotica, attribuita alla natura ricca di contatti di molte attività di manipolazione e alla complessità intrinseca nel coordinare un sistema bimanuale ad alta dimensionalità. In questo lavoro, consideriamo il problema di svitare tappi di vari oggetti simili a bottiglie con due mani, e dimostriamo che le politiche addestrate in simulazione utilizzando l'apprendimento per rinforzo profondo possono essere trasferite efficacemente nel mondo reale. Con nuove intuizioni ingegneristiche sulla modellazione fisica, la percezione in tempo reale e la progettazione delle ricompense, la politica dimostra capacità di generalizzazione su un insieme diversificato di oggetti non visti, mostrando comportamenti dinamici e destri. I nostri risultati rappresentano una prova convincente che l'apprendimento per rinforzo profondo combinato con il trasferimento da simulazione a realtà rimane un approccio promettente per affrontare problemi di manipolazione di complessità senza precedenti.
English
Manipulating objects with two multi-fingered hands has been a long-standing
challenge in robotics, attributed to the contact-rich nature of many
manipulation tasks and the complexity inherent in coordinating a
high-dimensional bimanual system. In this work, we consider the problem of
twisting lids of various bottle-like objects with two hands, and demonstrate
that policies trained in simulation using deep reinforcement learning can be
effectively transferred to the real world. With novel engineering insights into
physical modeling, real-time perception, and reward design, the policy
demonstrates generalization capabilities across a diverse set of unseen
objects, showcasing dynamic and dexterous behaviors. Our findings serve as
compelling evidence that deep reinforcement learning combined with sim-to-real
transfer remains a promising approach for addressing manipulation problems of
unprecedented complexity.