ChatPaper.aiChatPaper

Гибкость и безопасность: Обучение скоростному передвижению на ногах без столкновений

Agile But Safe: Learning Collision-Free High-Speed Legged Locomotion

January 31, 2024
Авторы: Tairan He, Chong Zhang, Wenli Xiao, Guanqi He, Changliu Liu, Guanya Shi
cs.AI

Аннотация

Роботы с конечностями, перемещающиеся в сложных условиях, должны быть одновременно маневренными для эффективного выполнения задач и безопасными, чтобы избежать столкновений с препятствиями или людьми. Существующие исследования либо разрабатывают консервативные контроллеры (скорость < 1,0 м/с) для обеспечения безопасности, либо сосредотачиваются на маневренности, не учитывая потенциально опасные столкновения. В данной статье представлена система Agile But Safe (ABS), основанная на обучении и обеспечивающая маневренное и бесстолкновительное передвижение для четвероногих роботов. ABS включает в себя маневренную политику для выполнения быстрых двигательных навыков среди препятствий и политику восстановления для предотвращения сбоев, совместно обеспечивая высокоскоростное и бесстолкновительное перемещение. Переключение между политиками в ABS управляется обученной сетью значений reach-avoid, основанной на теории управления, которая также направляет политику восстановления в качестве целевой функции, обеспечивая безопасность робота в замкнутом цикле. Процесс обучения включает в себя обучение маневренной политики, сети значений reach-avoid, политики восстановления и сети представления экстероцепции, все это происходит в симуляции. Обученные модули могут быть напрямую развернуты в реальном мире с использованием бортовых сенсоров и вычислений, что позволяет осуществлять высокоскоростное и бесстолкновительное перемещение в ограниченных пространствах как внутри помещений, так и на открытом воздухе, с учетом как статических, так и динамических препятствий.
English
Legged robots navigating cluttered environments must be jointly agile for efficient task execution and safe to avoid collisions with obstacles or humans. Existing studies either develop conservative controllers (< 1.0 m/s) to ensure safety, or focus on agility without considering potentially fatal collisions. This paper introduces Agile But Safe (ABS), a learning-based control framework that enables agile and collision-free locomotion for quadrupedal robots. ABS involves an agile policy to execute agile motor skills amidst obstacles and a recovery policy to prevent failures, collaboratively achieving high-speed and collision-free navigation. The policy switch in ABS is governed by a learned control-theoretic reach-avoid value network, which also guides the recovery policy as an objective function, thereby safeguarding the robot in a closed loop. The training process involves the learning of the agile policy, the reach-avoid value network, the recovery policy, and an exteroception representation network, all in simulation. These trained modules can be directly deployed in the real world with onboard sensing and computation, leading to high-speed and collision-free navigation in confined indoor and outdoor spaces with both static and dynamic obstacles.
PDF273December 15, 2024