ChatPaper.aiChatPaper

Cattura Agile con MPC a Corpo Intero e Apprendimento di Politiche Blackbox

Agile Catching with Whole-Body MPC and Blackbox Policy Learning

June 14, 2023
Autori: Saminda Abeyruwan, Alex Bewley, Nicholas M. Boffi, Krzysztof Choromanski, David D'Ambrosio, Deepali Jain, Pannag Sanketi, Anish Shankar, Vikas Sindhwani, Sumeet Singh, Jean-Jacques Slotine, Stephen Tu
cs.AI

Abstract

Affrontiamo un compito di riferimento nella robotica agile: la cattura di oggetti lanciati ad alta velocità. Si tratta di un'attività impegnativa che implica il tracciamento, l'intercettazione e l'accoglimento di un oggetto lanciato, avendo accesso solo alle osservazioni visive dell'oggetto e allo stato propriocettivo del robot, il tutto in una frazione di secondo. Presentiamo i meriti relativi di due strategie di soluzione fondamentalmente diverse: (i) il Controllo Predittivo basato su Modelli utilizzando l'ottimizzazione accelerata di traiettorie vincolate, e (ii) l'Apprendimento per Rinforzo utilizzando l'ottimizzazione di ordine zero. Forniamo approfondimenti su vari compromessi di prestazione, tra cui l'efficienza campionaria, il trasferimento da simulazione a realtà, la robustezza agli spostamenti di distribuzione e la multimodalità dell'intero corpo, attraverso esperimenti estensivi su hardware. Concludiamo con proposte sulla fusione di tecniche "classiche" e basate sull'apprendimento per il controllo agile dei robot. I video dei nostri esperimenti sono disponibili su https://sites.google.com/view/agile-catching.
English
We address a benchmark task in agile robotics: catching objects thrown at high-speed. This is a challenging task that involves tracking, intercepting, and cradling a thrown object with access only to visual observations of the object and the proprioceptive state of the robot, all within a fraction of a second. We present the relative merits of two fundamentally different solution strategies: (i) Model Predictive Control using accelerated constrained trajectory optimization, and (ii) Reinforcement Learning using zeroth-order optimization. We provide insights into various performance trade-offs including sample efficiency, sim-to-real transfer, robustness to distribution shifts, and whole-body multimodality via extensive on-hardware experiments. We conclude with proposals on fusing "classical" and "learning-based" techniques for agile robot control. Videos of our experiments may be found at https://sites.google.com/view/agile-catching
PDF81February 7, 2026