Décomposition de l'écart de généralisation dans l'apprentissage par imitation pour la manipulation robotique visuelle
Decomposing the Generalization Gap in Imitation Learning for Visual Robotic Manipulation
July 7, 2023
Auteurs: Annie Xie, Lisa Lee, Ted Xiao, Chelsea Finn
cs.AI
Résumé
Qu'est-ce qui rend la généralisation difficile pour l'apprentissage par imitation dans la manipulation robotique visuelle ? Cette question est difficile à aborder de prime abord, mais l'environnement du point de vue d'un robot peut souvent être décomposé en facteurs de variation énumérables, tels que les conditions d'éclairage ou le positionnement de la caméra. Empiriquement, la généralisation à certains de ces facteurs s'est avérée plus problématique qu'à d'autres, mais les travaux existants éclairent peu sur la contribution précise de chaque facteur à l'écart de généralisation. Pour répondre à cette question, nous étudions les politiques d'apprentissage par imitation en simulation et sur une tâche réelle de manipulation robotique conditionnée par le langage, afin de quantifier la difficulté de généralisation à différents (ensembles de) facteurs. Nous concevons également un nouveau benchmark simulé de 19 tâches avec 11 facteurs de variation pour faciliter des évaluations plus contrôlées de la généralisation. À partir de notre étude, nous établissons un classement des facteurs basé sur la difficulté de généralisation, qui est cohérent entre la simulation et notre configuration robotique réelle.
English
What makes generalization hard for imitation learning in visual robotic
manipulation? This question is difficult to approach at face value, but the
environment from the perspective of a robot can often be decomposed into
enumerable factors of variation, such as the lighting conditions or the
placement of the camera. Empirically, generalization to some of these factors
have presented a greater obstacle than others, but existing work sheds little
light on precisely how much each factor contributes to the generalization gap.
Towards an answer to this question, we study imitation learning policies in
simulation and on a real robot language-conditioned manipulation task to
quantify the difficulty of generalization to different (sets of) factors. We
also design a new simulated benchmark of 19 tasks with 11 factors of variation
to facilitate more controlled evaluations of generalization. From our study, we
determine an ordering of factors based on generalization difficulty, that is
consistent across simulation and our real robot setup.