Dopjes losdraaien met twee handen
Twisting Lids Off with Two Hands
March 4, 2024
Auteurs: Toru Lin, Zhao-Heng Yin, Haozhi Qi, Pieter Abbeel, Jitendra Malik
cs.AI
Samenvatting
Het manipuleren van objecten met twee multi-vingerige handen is een langdurige uitdaging geweest in de robotica, wat wordt toegeschreven aan het contactrijke karakter van veel manipulatietaken en de complexiteit die inherent is aan het coördineren van een hoogdimensionaal bimanueel systeem. In dit werk beschouwen we het probleem van het draaien van deksels van verschillende flesachtige objecten met twee handen, en tonen we aan dat beleidsregels die in simulatie zijn getraind met behulp van diepgaande reinforcement learning effectief kunnen worden overgedragen naar de echte wereld. Met nieuwe technische inzichten in fysieke modellering, real-time perceptie en beloningsontwerp toont het beleid generalisatievermogen over een diverse set van onbekende objecten, waarbij dynamisch en behendig gedrag wordt getoond. Onze bevindingen dienen als overtuigend bewijs dat diepgaande reinforcement learning gecombineerd met sim-to-real transfer een veelbelovende aanpak blijft voor het aanpakken van manipulatietaken van ongekende complexiteit.
English
Manipulating objects with two multi-fingered hands has been a long-standing
challenge in robotics, attributed to the contact-rich nature of many
manipulation tasks and the complexity inherent in coordinating a
high-dimensional bimanual system. In this work, we consider the problem of
twisting lids of various bottle-like objects with two hands, and demonstrate
that policies trained in simulation using deep reinforcement learning can be
effectively transferred to the real world. With novel engineering insights into
physical modeling, real-time perception, and reward design, the policy
demonstrates generalization capabilities across a diverse set of unseen
objects, showcasing dynamic and dexterous behaviors. Our findings serve as
compelling evidence that deep reinforcement learning combined with sim-to-real
transfer remains a promising approach for addressing manipulation problems of
unprecedented complexity.