ChatPaper.aiChatPaper

Agiles Fangen mit Ganzkörper-MPC und Blackbox-Policy-Learning

Agile Catching with Whole-Body MPC and Blackbox Policy Learning

June 14, 2023
Autoren: Saminda Abeyruwan, Alex Bewley, Nicholas M. Boffi, Krzysztof Choromanski, David D'Ambrosio, Deepali Jain, Pannag Sanketi, Anish Shankar, Vikas Sindhwani, Sumeet Singh, Jean-Jacques Slotine, Stephen Tu
cs.AI

Zusammenfassung

Wir behandeln eine Benchmark-Aufgabe in der agilen Robotik: das Fangen von Objekten, die mit hoher Geschwindigkeit geworfen werden. Dies ist eine anspruchsvolle Aufgabe, die das Verfolgen, Abfangen und Auffangen eines geworfenen Objekts beinhaltet, wobei nur visuelle Beobachtungen des Objekts und der propriozeptive Zustand des Roboters zur Verfügung stehen – alles innerhalb eines Bruchteils einer Sekunde. Wir präsentieren die relativen Vorzüge zweier grundlegend unterschiedlicher Lösungsstrategien: (i) Modellprädiktive Regelung unter Verwendung von beschleunigter, beschränkter Trajektorienoptimierung und (ii) Reinforcement Learning mit Optimierung nullter Ordnung. Wir geben Einblicke in verschiedene Leistungskompromisse, einschließlich Stichprobeneffizienz, Sim-to-Real-Transfer, Robustheit gegenüber Verteilungsverschiebungen und Ganzkörper-Multimodalität, durch umfangreiche Hardware-Experimente. Wir schließen mit Vorschlägen zur Fusion von „klassischen“ und „lernbasierten“ Techniken für die agile Robotersteuerung. Videos unserer Experimente finden Sie unter https://sites.google.com/view/agile-catching.
English
We address a benchmark task in agile robotics: catching objects thrown at high-speed. This is a challenging task that involves tracking, intercepting, and cradling a thrown object with access only to visual observations of the object and the proprioceptive state of the robot, all within a fraction of a second. We present the relative merits of two fundamentally different solution strategies: (i) Model Predictive Control using accelerated constrained trajectory optimization, and (ii) Reinforcement Learning using zeroth-order optimization. We provide insights into various performance trade-offs including sample efficiency, sim-to-real transfer, robustness to distribution shifts, and whole-body multimodality via extensive on-hardware experiments. We conclude with proposals on fusing "classical" and "learning-based" techniques for agile robot control. Videos of our experiments may be found at https://sites.google.com/view/agile-catching
PDF81December 15, 2024