Cattura Agile con MPC a Corpo Intero e Apprendimento di Politiche Blackbox
Agile Catching with Whole-Body MPC and Blackbox Policy Learning
June 14, 2023
Autori: Saminda Abeyruwan, Alex Bewley, Nicholas M. Boffi, Krzysztof Choromanski, David D'Ambrosio, Deepali Jain, Pannag Sanketi, Anish Shankar, Vikas Sindhwani, Sumeet Singh, Jean-Jacques Slotine, Stephen Tu
cs.AI
Abstract
Affrontiamo un compito di riferimento nella robotica agile: la cattura di oggetti lanciati ad alta velocità. Si tratta di un'attività impegnativa che implica il tracciamento, l'intercettazione e l'accoglimento di un oggetto lanciato, avendo accesso solo alle osservazioni visive dell'oggetto e allo stato propriocettivo del robot, il tutto in una frazione di secondo. Presentiamo i meriti relativi di due strategie di soluzione fondamentalmente diverse: (i) il Controllo Predittivo basato su Modelli utilizzando l'ottimizzazione accelerata di traiettorie vincolate, e (ii) l'Apprendimento per Rinforzo utilizzando l'ottimizzazione di ordine zero. Forniamo approfondimenti su vari compromessi di prestazione, tra cui l'efficienza campionaria, il trasferimento da simulazione a realtà, la robustezza agli spostamenti di distribuzione e la multimodalità dell'intero corpo, attraverso esperimenti estensivi su hardware. Concludiamo con proposte sulla fusione di tecniche "classiche" e basate sull'apprendimento per il controllo agile dei robot. I video dei nostri esperimenti sono disponibili su https://sites.google.com/view/agile-catching.
English
We address a benchmark task in agile robotics: catching objects thrown at
high-speed. This is a challenging task that involves tracking, intercepting,
and cradling a thrown object with access only to visual observations of the
object and the proprioceptive state of the robot, all within a fraction of a
second. We present the relative merits of two fundamentally different solution
strategies: (i) Model Predictive Control using accelerated constrained
trajectory optimization, and (ii) Reinforcement Learning using zeroth-order
optimization. We provide insights into various performance trade-offs including
sample efficiency, sim-to-real transfer, robustness to distribution shifts, and
whole-body multimodality via extensive on-hardware experiments. We conclude
with proposals on fusing "classical" and "learning-based" techniques for agile
robot control. Videos of our experiments may be found at
https://sites.google.com/view/agile-catching