Agil aber sicher: Erlernen kollisionsfreier Hochgeschwindigkeitsfortbewegung mit Beinrobotern
Agile But Safe: Learning Collision-Free High-Speed Legged Locomotion
January 31, 2024
Autoren: Tairan He, Chong Zhang, Wenli Xiao, Guanqi He, Changliu Liu, Guanya Shi
cs.AI
Zusammenfassung
Beinroboter, die in unübersichtlichen Umgebungen navigieren, müssen gleichzeitig agil sein, um Aufgaben effizient auszuführen, und sicher, um Kollisionen mit Hindernissen oder Menschen zu vermeiden. Bisherige Studien entwickeln entweder konservative Controller (< 1,0 m/s), um Sicherheit zu gewährleisten, oder konzentrieren sich auf Agilität, ohne potenziell gefährliche Kollisionen zu berücksichtigen. Dieses Paper stellt Agile But Safe (ABS) vor, ein lernbasiertes Steuerungsframework, das agile und kollisionsfreie Fortbewegung für vierbeinige Roboter ermöglicht. ABS umfasst eine agile Policy zur Ausführung agiler Motorikfähigkeiten inmitten von Hindernissen und eine Recovery Policy, um Fehler zu verhindern, wodurch gemeinsam eine schnelle und kollisionsfreie Navigation erreicht wird. Der Policy-Wechsel in ABS wird durch ein gelerntes, kontrolltheoretisches Reach-Avoid-Wertnetzwerk gesteuert, das auch die Recovery Policy als Zielfunktion leitet und so den Roboter in einer geschlossenen Schleife schützt. Der Trainingsprozess umfasst das Erlernen der agilen Policy, des Reach-Avoid-Wertnetzwerks, der Recovery Policy und eines Exterozeptions-Repräsentationsnetzwerks, alles in der Simulation. Diese trainierten Module können direkt in der realen Welt mit Onboard-Sensorik und -Berechnung eingesetzt werden, was zu schneller und kollisionsfreier Navigation in engen Innen- und Außenbereichen mit sowohl statischen als auch dynamischen Hindernissen führt.
English
Legged robots navigating cluttered environments must be jointly agile for
efficient task execution and safe to avoid collisions with obstacles or humans.
Existing studies either develop conservative controllers (< 1.0 m/s) to ensure
safety, or focus on agility without considering potentially fatal collisions.
This paper introduces Agile But Safe (ABS), a learning-based control framework
that enables agile and collision-free locomotion for quadrupedal robots. ABS
involves an agile policy to execute agile motor skills amidst obstacles and a
recovery policy to prevent failures, collaboratively achieving high-speed and
collision-free navigation. The policy switch in ABS is governed by a learned
control-theoretic reach-avoid value network, which also guides the recovery
policy as an objective function, thereby safeguarding the robot in a closed
loop. The training process involves the learning of the agile policy, the
reach-avoid value network, the recovery policy, and an exteroception
representation network, all in simulation. These trained modules can be
directly deployed in the real world with onboard sensing and computation,
leading to high-speed and collision-free navigation in confined indoor and
outdoor spaces with both static and dynamic obstacles.