ChatPaper.aiChatPaper

민첩하지만 안전한: 고속 충돌 방지 다리형 보행 학습

Agile But Safe: Learning Collision-Free High-Speed Legged Locomotion

January 31, 2024
저자: Tairan He, Chong Zhang, Wenli Xiao, Guanqi He, Changliu Liu, Guanya Shi
cs.AI

초록

복잡한 환경을 탐색하는 다족 보행 로봇은 효율적인 작업 수행을 위해 민첩해야 하며, 장애물이나 인간과의 충돌을 피하기 위해 안전해야 합니다. 기존 연구들은 안전을 보장하기 위해 보수적인 컨트롤러(< 1.0 m/s)를 개발하거나, 치명적인 충돌을 고려하지 않고 민첩성에만 초점을 맞추는 경향이 있었습니다. 본 논문은 사족 보행 로봇을 위한 민첩하고 충돌 없는 이동을 가능하게 하는 학습 기반 제어 프레임워크인 Agile But Safe(ABS)를 소개합니다. ABS는 장애물 사이에서 민첩한 모터 스킬을 실행하는 민첩 정책과 실패를 방지하기 위한 복구 정책을 포함하여, 고속 및 충돌 없는 탐색을 협력적으로 달성합니다. ABS의 정책 전환은 학습된 제어 이론적 도달-회피 값 네트워크에 의해 제어되며, 이 네트워크는 또한 복구 정책을 목적 함수로 안내하여 폐루프에서 로봇을 보호합니다. 학습 과정은 민첩 정책, 도달-회피 값 네트워크, 복구 정책, 그리고 외부 감지 표현 네트워크의 학습을 시뮬레이션 환경에서 모두 포함합니다. 이러한 학습된 모듈은 온보드 센싱과 컴퓨팅을 통해 실제 환경에 직접 배포될 수 있으며, 정적 및 동적 장애물이 있는 제한된 실내 및 야외 공간에서 고속 및 충돌 없는 탐색을 가능하게 합니다.
English
Legged robots navigating cluttered environments must be jointly agile for efficient task execution and safe to avoid collisions with obstacles or humans. Existing studies either develop conservative controllers (< 1.0 m/s) to ensure safety, or focus on agility without considering potentially fatal collisions. This paper introduces Agile But Safe (ABS), a learning-based control framework that enables agile and collision-free locomotion for quadrupedal robots. ABS involves an agile policy to execute agile motor skills amidst obstacles and a recovery policy to prevent failures, collaboratively achieving high-speed and collision-free navigation. The policy switch in ABS is governed by a learned control-theoretic reach-avoid value network, which also guides the recovery policy as an objective function, thereby safeguarding the robot in a closed loop. The training process involves the learning of the agile policy, the reach-avoid value network, the recovery policy, and an exteroception representation network, all in simulation. These trained modules can be directly deployed in the real world with onboard sensing and computation, leading to high-speed and collision-free navigation in confined indoor and outdoor spaces with both static and dynamic obstacles.
PDF273December 15, 2024