Agile mais sûr : Apprentissage d'une locomotion rapide sans collision pour les robots à pattes

papers.abstract

Les robots à pattes naviguant dans des environnements encombrés doivent être à la fois agiles pour une exécution efficace des tâches et sûrs pour éviter les collisions avec des obstacles ou des humains. Les études existantes développent soit des contrôleurs conservateurs (< 1,0 m/s) pour garantir la sécurité, soit se concentrent sur l'agilité sans tenir compte des collisions potentiellement fatales. Cet article présente Agile But Safe (ABS), un cadre de contrôle basé sur l'apprentissage qui permet une locomotion agile et sans collision pour les robots quadrupèdes. ABS comprend une politique agile pour exécuter des compétences motrices agiles parmi les obstacles et une politique de récupération pour prévenir les échecs, collaborant ainsi à une navigation à haute vitesse et sans collision. Le passage d'une politique à l'autre dans ABS est gouverné par un réseau de valeur d'atteinte-évitement basé sur la théorie du contrôle, qui guide également la politique de récupération en tant que fonction objectif, protégeant ainsi le robot en boucle fermée. Le processus d'entraînement implique l'apprentissage de la politique agile, du réseau de valeur d'atteinte-évitement, de la politique de récupération et d'un réseau de représentation extéroceptive, le tout en simulation. Ces modules entraînés peuvent être directement déployés dans le monde réel avec une perception et un calcul embarqués, permettant une navigation à haute vitesse et sans collision dans des espaces confinés, intérieurs et extérieurs, avec des obstacles statiques et dynamiques.

English

Legged robots navigating cluttered environments must be jointly agile for efficient task execution and safe to avoid collisions with obstacles or humans. Existing studies either develop conservative controllers (< 1.0 m/s) to ensure safety, or focus on agility without considering potentially fatal collisions. This paper introduces Agile But Safe (ABS), a learning-based control framework that enables agile and collision-free locomotion for quadrupedal robots. ABS involves an agile policy to execute agile motor skills amidst obstacles and a recovery policy to prevent failures, collaboratively achieving high-speed and collision-free navigation. The policy switch in ABS is governed by a learned control-theoretic reach-avoid value network, which also guides the recovery policy as an objective function, thereby safeguarding the robot in a closed loop. The training process involves the learning of the agile policy, the reach-avoid value network, the recovery policy, and an exteroception representation network, all in simulation. These trained modules can be directly deployed in the real world with onboard sensing and computation, leading to high-speed and collision-free navigation in confined indoor and outdoor spaces with both static and dynamic obstacles.

Agile mais sûr : Apprentissage d'une locomotion rapide sans collision pour les robots à pattes

Agile But Safe: Learning Collision-Free High-Speed Legged Locomotion

papers.abstract

Support