ChatPaper.aiChatPaper

Dextérité séquentielle : Enchaînement de politiques dextres pour la manipulation à long horizon

Sequential Dexterity: Chaining Dexterous Policies for Long-Horizon Manipulation

September 2, 2023
Auteurs: Yuanpei Chen, Chen Wang, Li Fei-Fei, C. Karen Liu
cs.AI

Résumé

De nombreuses tâches de manipulation dans le monde réel consistent en une série de sous-tâches qui diffèrent considérablement les unes des autres. Ces tâches complexes à long terme mettent en lumière le potentiel des mains dextres, qui possèdent une adaptabilité et une polyvalence leur permettant de passer de manière fluide entre différents modes de fonctionnement sans nécessiter de reprise de préhension ou d'outils externes. Cependant, les défis surgissent en raison de l'espace d'action à haute dimension des mains dextres et de la dynamique compositionnelle complexe des tâches à long terme. Nous présentons Sequential Dexterity, un système général basé sur l'apprentissage par renforcement (RL) qui enchaîne plusieurs politiques dextres pour atteindre des objectifs de tâches à long terme. Le cœur du système est une fonction de faisabilité de transition qui affine progressivement les sous-politiques pour améliorer le taux de réussite de l'enchaînement, tout en permettant un changement de politique autonome pour récupérer après des échecs et contourner des étapes redondantes. Bien qu'il ait été entraîné uniquement en simulation avec quelques objets de tâche, notre système démontre une capacité de généralisation à de nouvelles formes d'objets et est capable de transférer sans adaptation (zero-shot) à un robot réel équipé d'une main dextre. Plus de détails et des résultats vidéo sont disponibles à l'adresse suivante : https://sequential-dexterity.github.io.
English
Many real-world manipulation tasks consist of a series of subtasks that are significantly different from one another. Such long-horizon, complex tasks highlight the potential of dexterous hands, which possess adaptability and versatility, capable of seamlessly transitioning between different modes of functionality without the need for re-grasping or external tools. However, the challenges arise due to the high-dimensional action space of dexterous hand and complex compositional dynamics of the long-horizon tasks. We present Sequential Dexterity, a general system based on reinforcement learning (RL) that chains multiple dexterous policies for achieving long-horizon task goals. The core of the system is a transition feasibility function that progressively finetunes the sub-policies for enhancing chaining success rate, while also enables autonomous policy-switching for recovery from failures and bypassing redundant stages. Despite being trained only in simulation with a few task objects, our system demonstrates generalization capability to novel object shapes and is able to zero-shot transfer to a real-world robot equipped with a dexterous hand. More details and video results could be found at https://sequential-dexterity.github.io
PDF40December 15, 2024