ChatPaper.aiChatPaper

Cross Anything : Navigation Générale de Robots Quadrupèdes à Travers des Terrains Complexes

Cross Anything: General Quadruped Robot Navigation through Complex Terrains

July 23, 2024
Auteurs: Shaoting Zhu, Derun Li, Yong Liu, Ningyi Xu, Hang Zhao
cs.AI

Résumé

L'application des modèles vision-langage (VLMs) a obtenu un succès impressionnant dans diverses tâches robotiques, mais il existe peu d'explorations concernant l'utilisation de modèles fondateurs pour la navigation des robots quadrupèdes. Nous présentons le système Cross Anything System (CAS), une innovation composée d'un module de raisonnement de haut niveau et d'une politique de contrôle de bas niveau, permettant au robot de naviguer sur des terrains 3D complexes et d'atteindre la position cible. Pour le raisonnement de haut niveau et la planification de mouvement, nous proposons un système algorithmique novateur exploitant un VLM, avec une conception de décomposition de tâches et un mécanisme d'exécution en boucle fermée des sous-tâches. Pour le contrôle de locomotion de bas niveau, nous utilisons la méthode de sélection par recuit probabiliste (PAS) pour entraîner une politique de contrôle par apprentissage par renforcement. De nombreuses expériences montrent que notre système complet peut naviguer avec précision et robustesse sur des terrains 3D complexes, et sa forte capacité de généralisation assure des applications dans divers scénarios et terrains intérieurs et extérieurs. Page du projet : https://cross-anything.github.io/
English
The application of vision-language models (VLMs) has achieved impressive success in various robotics tasks, but there are few explorations for foundation models used in quadruped robot navigation. We introduce Cross Anything System (CAS), an innovative system composed of a high-level reasoning module and a low-level control policy, enabling the robot to navigate across complex 3D terrains and reach the goal position. For high-level reasoning and motion planning, we propose a novel algorithmic system taking advantage of a VLM, with a design of task decomposition and a closed-loop sub-task execution mechanism. For low-level locomotion control, we utilize the Probability Annealing Selection (PAS) method to train a control policy by reinforcement learning. Numerous experiments show that our whole system can accurately and robustly navigate across complex 3D terrains, and its strong generalization ability ensures the applications in diverse indoor and outdoor scenarios and terrains. Project page: https://cross-anything.github.io/

Summary

AI-Generated Summary

PDF62November 28, 2024