Descomponiendo la Brecha de Generalización en el Aprendizaje por Imitación para la Manipulación Robótica Visual
Decomposing the Generalization Gap in Imitation Learning for Visual Robotic Manipulation
July 7, 2023
Autores: Annie Xie, Lisa Lee, Ted Xiao, Chelsea Finn
cs.AI
Resumen
¿Qué hace que la generalización sea difícil en el aprendizaje por imitación para la manipulación robótica visual? Esta pregunta es difícil de abordar de manera directa, pero el entorno desde la perspectiva de un robot a menudo puede descomponerse en factores enumerables de variación, como las condiciones de iluminación o la ubicación de la cámara. Empíricamente, la generalización a algunos de estos factores ha presentado un obstáculo mayor que otros, pero el trabajo existente arroja poca luz sobre cuánto contribuye exactamente cada factor a la brecha de generalización. Para responder a esta pregunta, estudiamos políticas de aprendizaje por imitación en simulación y en una tarea de manipulación condicionada por lenguaje en un robot real, con el fin de cuantificar la dificultad de generalización a diferentes (conjuntos de) factores. También diseñamos un nuevo punto de referencia simulado de 19 tareas con 11 factores de variación para facilitar evaluaciones más controladas de la generalización. A partir de nuestro estudio, determinamos un orden de factores basado en la dificultad de generalización, que es consistente tanto en la simulación como en nuestra configuración de robot real.
English
What makes generalization hard for imitation learning in visual robotic
manipulation? This question is difficult to approach at face value, but the
environment from the perspective of a robot can often be decomposed into
enumerable factors of variation, such as the lighting conditions or the
placement of the camera. Empirically, generalization to some of these factors
have presented a greater obstacle than others, but existing work sheds little
light on precisely how much each factor contributes to the generalization gap.
Towards an answer to this question, we study imitation learning policies in
simulation and on a real robot language-conditioned manipulation task to
quantify the difficulty of generalization to different (sets of) factors. We
also design a new simulated benchmark of 19 tasks with 11 factors of variation
to facilitate more controlled evaluations of generalization. From our study, we
determine an ordering of factors based on generalization difficulty, that is
consistent across simulation and our real robot setup.