Agile mais sûr : Apprentissage d'une locomotion rapide sans collision pour les robots à pattes
Agile But Safe: Learning Collision-Free High-Speed Legged Locomotion
January 31, 2024
Auteurs: Tairan He, Chong Zhang, Wenli Xiao, Guanqi He, Changliu Liu, Guanya Shi
cs.AI
Résumé
Les robots à pattes naviguant dans des environnements encombrés doivent être à la fois agiles pour une exécution efficace des tâches et sûrs pour éviter les collisions avec des obstacles ou des humains. Les études existantes développent soit des contrôleurs conservateurs (< 1,0 m/s) pour garantir la sécurité, soit se concentrent sur l'agilité sans tenir compte des collisions potentiellement fatales. Cet article présente Agile But Safe (ABS), un cadre de contrôle basé sur l'apprentissage qui permet une locomotion agile et sans collision pour les robots quadrupèdes. ABS comprend une politique agile pour exécuter des compétences motrices agiles parmi les obstacles et une politique de récupération pour prévenir les échecs, collaborant ainsi à une navigation à haute vitesse et sans collision. Le passage d'une politique à l'autre dans ABS est gouverné par un réseau de valeur d'atteinte-évitement basé sur la théorie du contrôle, qui guide également la politique de récupération en tant que fonction objectif, protégeant ainsi le robot en boucle fermée. Le processus d'entraînement implique l'apprentissage de la politique agile, du réseau de valeur d'atteinte-évitement, de la politique de récupération et d'un réseau de représentation extéroceptive, le tout en simulation. Ces modules entraînés peuvent être directement déployés dans le monde réel avec une perception et un calcul embarqués, permettant une navigation à haute vitesse et sans collision dans des espaces confinés, intérieurs et extérieurs, avec des obstacles statiques et dynamiques.
English
Legged robots navigating cluttered environments must be jointly agile for
efficient task execution and safe to avoid collisions with obstacles or humans.
Existing studies either develop conservative controllers (< 1.0 m/s) to ensure
safety, or focus on agility without considering potentially fatal collisions.
This paper introduces Agile But Safe (ABS), a learning-based control framework
that enables agile and collision-free locomotion for quadrupedal robots. ABS
involves an agile policy to execute agile motor skills amidst obstacles and a
recovery policy to prevent failures, collaboratively achieving high-speed and
collision-free navigation. The policy switch in ABS is governed by a learned
control-theoretic reach-avoid value network, which also guides the recovery
policy as an objective function, thereby safeguarding the robot in a closed
loop. The training process involves the learning of the agile policy, the
reach-avoid value network, the recovery policy, and an exteroception
representation network, all in simulation. These trained modules can be
directly deployed in the real world with onboard sensing and computation,
leading to high-speed and collision-free navigation in confined indoor and
outdoor spaces with both static and dynamic obstacles.