Decompondo a Lacuna de Generalização no Aprendizado por Imitação para Manipulação Robótica Visual
Decomposing the Generalization Gap in Imitation Learning for Visual Robotic Manipulation
July 7, 2023
Autores: Annie Xie, Lisa Lee, Ted Xiao, Chelsea Finn
cs.AI
Resumo
O que torna a generalização difícil para o aprendizado por imitação na manipulação robótica visual? Essa questão é difícil de abordar de forma direta, mas o ambiente, do ponto de vista de um robô, pode frequentemente ser decomposto em fatores enumeráveis de variação, como as condições de iluminação ou a posição da câmera. Empiricamente, a generalização para alguns desses fatores tem se mostrado um obstáculo maior do que para outros, mas trabalhos existentes lançam pouca luz sobre exatamente quanto cada fator contribui para a lacuna de generalização. Em busca de uma resposta para essa questão, estudamos políticas de aprendizado por imitação em simulação e em uma tarefa de manipulação condicionada por linguagem em um robô real, para quantificar a dificuldade de generalização para diferentes (conjuntos de) fatores. Também projetamos um novo benchmark simulado com 19 tarefas e 11 fatores de variação para facilitar avaliações mais controladas da generalização. A partir do nosso estudo, determinamos uma ordenação dos fatores com base na dificuldade de generalização, que é consistente entre a simulação e nossa configuração de robô real.
English
What makes generalization hard for imitation learning in visual robotic
manipulation? This question is difficult to approach at face value, but the
environment from the perspective of a robot can often be decomposed into
enumerable factors of variation, such as the lighting conditions or the
placement of the camera. Empirically, generalization to some of these factors
have presented a greater obstacle than others, but existing work sheds little
light on precisely how much each factor contributes to the generalization gap.
Towards an answer to this question, we study imitation learning policies in
simulation and on a real robot language-conditioned manipulation task to
quantify the difficulty of generalization to different (sets of) factors. We
also design a new simulated benchmark of 19 tasks with 11 factors of variation
to facilitate more controlled evaluations of generalization. From our study, we
determine an ordering of factors based on generalization difficulty, that is
consistent across simulation and our real robot setup.