ChatPaper.aiChatPaper

Ágil pero seguro: Aprendizaje de locomoción bípeda de alta velocidad libre de colisiones

Agile But Safe: Learning Collision-Free High-Speed Legged Locomotion

January 31, 2024
Autores: Tairan He, Chong Zhang, Wenli Xiao, Guanqi He, Changliu Liu, Guanya Shi
cs.AI

Resumen

Los robots con patas que navegan en entornos abarrotados deben ser ágiles para ejecutar tareas de manera eficiente y seguros para evitar colisiones con obstáculos o humanos. Los estudios existentes desarrollan controladores conservadores (< 1.0 m/s) para garantizar la seguridad o se centran en la agilidad sin considerar colisiones potencialmente fatales. Este artículo presenta Agile But Safe (ABS), un marco de control basado en aprendizaje que permite una locomoción ágil y libre de colisiones para robots cuadrúpedos. ABS incluye una política ágil para ejecutar habilidades motoras ágiles entre obstáculos y una política de recuperación para prevenir fallos, logrando de manera colaborativa una navegación a alta velocidad y sin colisiones. El cambio de política en ABS está gobernado por una red de valor de alcance-evasión basada en teoría de control aprendida, que también guía la política de recuperación como una función objetivo, protegiendo así al robot en un bucle cerrado. El proceso de entrenamiento implica el aprendizaje de la política ágil, la red de valor de alcance-evasión, la política de recuperación y una red de representación de exterocepción, todo en simulación. Estos módulos entrenados pueden implementarse directamente en el mundo real con sensores y computación a bordo, permitiendo una navegación a alta velocidad y sin colisiones en espacios confinados, tanto interiores como exteriores, con obstáculos estáticos y dinámicos.
English
Legged robots navigating cluttered environments must be jointly agile for efficient task execution and safe to avoid collisions with obstacles or humans. Existing studies either develop conservative controllers (< 1.0 m/s) to ensure safety, or focus on agility without considering potentially fatal collisions. This paper introduces Agile But Safe (ABS), a learning-based control framework that enables agile and collision-free locomotion for quadrupedal robots. ABS involves an agile policy to execute agile motor skills amidst obstacles and a recovery policy to prevent failures, collaboratively achieving high-speed and collision-free navigation. The policy switch in ABS is governed by a learned control-theoretic reach-avoid value network, which also guides the recovery policy as an objective function, thereby safeguarding the robot in a closed loop. The training process involves the learning of the agile policy, the reach-avoid value network, the recovery policy, and an exteroception representation network, all in simulation. These trained modules can be directly deployed in the real world with onboard sensing and computation, leading to high-speed and collision-free navigation in confined indoor and outdoor spaces with both static and dynamic obstacles.
PDF273December 15, 2024