ChatPaper.aiChatPaper

Apprentissage de politiques robotiques de poursuite-évasion basées sur la vision

Learning Vision-based Pursuit-Evasion Robot Policies

August 30, 2023
Auteurs: Andrea Bajcsy, Antonio Loquercio, Ashish Kumar, Jitendra Malik
cs.AI

Résumé

L'apprentissage de comportements stratégiques pour les robots -- comme ceux requis dans les interactions de poursuite-évasion -- sous les contraintes du monde réel est extrêmement complexe. Cela nécessite d'exploiter la dynamique de l'interaction et de planifier en tenant compte à la fois de l'incertitude sur l'état physique et de l'intention latente. Dans cet article, nous transformons ce problème insoluble en un problème d'apprentissage supervisé, où une politique robotique entièrement observable génère des données de supervision pour une politique partiellement observable. Nous constatons que la qualité du signal de supervision pour la politique de poursuite partiellement observable dépend de deux facteurs clés : l'équilibre entre la diversité et l'optimalité du comportement de l'évadé, ainsi que la robustesse des hypothèses de modélisation dans la politique entièrement observable. Nous déployons notre politique sur un robot quadrupède physique équipé d'une caméra RGB-D pour des interactions de poursuite-évasion en conditions réelles. Malgré tous les défis, les contraintes de perception stimulent la créativité : le robot est incité à collecter des informations en cas d'incertitude, à prédire l'intention à partir de mesures bruitées, et à anticiper pour intercepter. Page web du projet : https://abajcsy.github.io/vision-based-pursuit/
English
Learning strategic robot behavior -- like that required in pursuit-evasion interactions -- under real-world constraints is extremely challenging. It requires exploiting the dynamics of the interaction, and planning through both physical state and latent intent uncertainty. In this paper, we transform this intractable problem into a supervised learning problem, where a fully-observable robot policy generates supervision for a partially-observable one. We find that the quality of the supervision signal for the partially-observable pursuer policy depends on two key factors: the balance of diversity and optimality of the evader's behavior and the strength of the modeling assumptions in the fully-observable policy. We deploy our policy on a physical quadruped robot with an RGB-D camera on pursuit-evasion interactions in the wild. Despite all the challenges, the sensing constraints bring about creativity: the robot is pushed to gather information when uncertain, predict intent from noisy measurements, and anticipate in order to intercept. Project webpage: https://abajcsy.github.io/vision-based-pursuit/
PDF70December 15, 2024