Entmystifizierung der Gestaltung des Aktionsraums für Robotic-Manipulations-Policies

Zusammenfassung

Die Spezifikation des Aktionsraums spielt eine entscheidende Rolle beim imitationsbasierten Lernen von Robotermanipulationspolitiken, da sie die Optimierungslandschaft des Politik-Lernens grundlegend formt. Während sich jüngste Fortschritte stark auf die Skalierung von Trainingsdaten und Modellkapazität konzentriert haben, wird die Wahl des Aktionsraums weiterhin von Ad-hoc-Heuristiken oder etablierten Legacy-Designs geleitet, was zu einem unklaren Verständnis der zugrundeliegenden Designphilosophien für Roboterpolitiken führt. Um diese Unklarheit zu adressieren, führten wir eine umfangreiche und systematische empirische Studie durch, die bestätigt, dass der Aktionsraum tatsächlich signifikante und komplexe Auswirkungen auf das Lernen von Roboterpolitiken hat. Wir unterteilen den Aktionsdesign-Raum entlang zeitlicher und räumlicher Achsen, um eine strukturierte Analyse zu ermöglichen, wie diese Wahlentscheidungen sowohl die Erlernbarkeit der Politik als auch die Regelungsstabilität beeinflussen. Basierend auf über 13.000 Realwelt-Testläufen an einem bimanuellen Roboter und der Auswertung von über 500 trainierten Modellen in vier Szenarien untersuchen wir die Kompromisse zwischen absoluten und Delta-Repräsentationen sowie Gelenkraum- und Arbeitsraum-Parametrisierungen. Unsere umfangreichen Ergebnisse deuten darauf hin, dass ein geeignetes Design der Politik zur Vorhersage von Delta-Aktionen durchweg die Leistung verbessert, während Gelenkraum- und Arbeitsraum-Repräsentationen komplementäre Stärken bieten, die jeweils Regelungsstabilität bzw. Generalisierung begünstigen.

English

The specification of the action space plays a pivotal role in imitation-based robotic manipulation policy learning, fundamentally shaping the optimization landscape of policy learning. While recent advances have focused heavily on scaling training data and model capacity, the choice of action space remains guided by ad-hoc heuristics or legacy designs, leading to an ambiguous understanding of robotic policy design philosophies. To address this ambiguity, we conducted a large-scale and systematic empirical study, confirming that the action space does have significant and complex impacts on robotic policy learning. We dissect the action design space along temporal and spatial axes, facilitating a structured analysis of how these choices govern both policy learnability and control stability. Based on 13,000+ real-world rollouts on a bimanual robot and evaluation on 500+ trained models over four scenarios, we examine the trade-offs between absolute vs. delta representations, and joint-space vs. task-space parameterizations. Our large-scale results suggest that properly designing the policy to predict delta actions consistently improves performance, while joint-space and task-space representations offer complementary strengths, favoring control stability and generalization, respectively.

Entmystifizierung der Gestaltung des Aktionsraums für Robotic-Manipulations-Policies

Demystifying Action Space Design for Robotic Manipulation Policies

Zusammenfassung

Support