Разложение обобщающего разрыва в имитационном обучении для визуального управления роботами
Decomposing the Generalization Gap in Imitation Learning for Visual Robotic Manipulation
July 7, 2023
Авторы: Annie Xie, Lisa Lee, Ted Xiao, Chelsea Finn
cs.AI
Аннотация
Что делает обобщение сложным для имитационного обучения в визуальной роботизированной манипуляции? Этот вопрос трудно рассмотреть на первый взгляд, но окружение с точки зрения робота часто можно разложить на перечислимые факторы изменчивости, такие как условия освещения или расположение камеры. Эмпирически обобщение на некоторые из этих факторов представляло большую сложность, чем на другие, но существующие работы мало проливают свет на то, насколько каждый фактор вносит вклад в разрыв обобщения. В поисках ответа на этот вопрос мы изучаем политики имитационного обучения в симуляции и на реальной роботизированной задаче манипуляции с языковым условием, чтобы количественно оценить сложность обобщения на различные (наборы) факторов. Мы также разрабатываем новый симулированный бенчмарк из 19 задач с 11 факторами изменчивости, чтобы облегчить более контролируемую оценку обобщения. В результате нашего исследования мы определяем порядок факторов на основе сложности обобщения, который согласуется как в симуляции, так и в нашей реальной роботизированной установке.
English
What makes generalization hard for imitation learning in visual robotic
manipulation? This question is difficult to approach at face value, but the
environment from the perspective of a robot can often be decomposed into
enumerable factors of variation, such as the lighting conditions or the
placement of the camera. Empirically, generalization to some of these factors
have presented a greater obstacle than others, but existing work sheds little
light on precisely how much each factor contributes to the generalization gap.
Towards an answer to this question, we study imitation learning policies in
simulation and on a real robot language-conditioned manipulation task to
quantify the difficulty of generalization to different (sets of) factors. We
also design a new simulated benchmark of 19 tasks with 11 factors of variation
to facilitate more controlled evaluations of generalization. From our study, we
determine an ordering of factors based on generalization difficulty, that is
consistent across simulation and our real robot setup.