Zerlegung der Generalisierungslücke im Imitationslernen für visuelle robotische Manipulation
Decomposing the Generalization Gap in Imitation Learning for Visual Robotic Manipulation
July 7, 2023
Autoren: Annie Xie, Lisa Lee, Ted Xiao, Chelsea Finn
cs.AI
Zusammenfassung
Was macht Generalisierung in der Imitationslernforschung für die visuelle Roboter-Manipulation so schwierig? Diese Frage ist auf den ersten Blick schwer zu beantworten, aber die Umgebung aus der Perspektive eines Roboters lässt sich oft in zahlreiche Variationsfaktoren zerlegen, wie etwa die Lichtverhältnisse oder die Platzierung der Kamera. Empirisch hat sich gezeigt, dass die Generalisierung bei einigen dieser Faktoren eine größere Herausforderung darstellt als bei anderen, doch bisherige Arbeiten geben wenig Aufschluss darüber, wie stark jeder einzelne Faktor zur Generalisierungslücke beiträgt. Um eine Antwort auf diese Frage zu finden, untersuchen wir Imitationslernstrategien in der Simulation und in einer realen Roboteraufgabe zur sprachgesteuerten Manipulation, um den Schwierigkeitsgrad der Generalisierung für verschiedene (Kombinationen von) Faktoren zu quantifizieren. Zudem entwickeln wir einen neuen simulierten Benchmark mit 19 Aufgaben und 11 Variationsfaktoren, um kontrolliertere Bewertungen der Generalisierung zu ermöglichen. Aus unserer Studie leiten wir eine Reihenfolge der Faktoren basierend auf dem Schwierigkeitsgrad der Generalisierung ab, die sowohl in der Simulation als auch in unserem realen Robotersystem konsistent ist.
English
What makes generalization hard for imitation learning in visual robotic
manipulation? This question is difficult to approach at face value, but the
environment from the perspective of a robot can often be decomposed into
enumerable factors of variation, such as the lighting conditions or the
placement of the camera. Empirically, generalization to some of these factors
have presented a greater obstacle than others, but existing work sheds little
light on precisely how much each factor contributes to the generalization gap.
Towards an answer to this question, we study imitation learning policies in
simulation and on a real robot language-conditioned manipulation task to
quantify the difficulty of generalization to different (sets of) factors. We
also design a new simulated benchmark of 19 tasks with 11 factors of variation
to facilitate more controlled evaluations of generalization. From our study, we
determine an ordering of factors based on generalization difficulty, that is
consistent across simulation and our real robot setup.