ChatPaper.aiChatPaper

Wendbaar vangen met Whole-Body MPC en Blackbox Policy Learning

Agile Catching with Whole-Body MPC and Blackbox Policy Learning

June 14, 2023
Auteurs: Saminda Abeyruwan, Alex Bewley, Nicholas M. Boffi, Krzysztof Choromanski, David D'Ambrosio, Deepali Jain, Pannag Sanketi, Anish Shankar, Vikas Sindhwani, Sumeet Singh, Jean-Jacques Slotine, Stephen Tu
cs.AI

Samenvatting

We behandelen een benchmarktaak in agile robotica: het vangen van objecten die met hoge snelheid worden gegooid. Dit is een uitdagende taak die het volgen, onderscheppen en zachtjes opvangen van een gegooid object omvat, met alleen toegang tot visuele waarnemingen van het object en de proprioceptieve staat van de robot, alles binnen een fractie van een seconde. We presenteren de relatieve voordelen van twee fundamenteel verschillende oplossingsstrategieën: (i) Model Predictive Control met behulp van versnelde, beperkte trajectoptimalisatie, en (ii) Reinforcement Learning met behulp van nulde-orde optimalisatie. We bieden inzichten in verschillende prestatieafwegingen, waaronder sample-efficiëntie, sim-to-real transfer, robuustheid tegen distributieverschuivingen en whole-body multimodality via uitgebreide experimenten op hardware. We sluiten af met voorstellen voor het combineren van "klassieke" en "op leren gebaseerde" technieken voor agile robotbesturing. Video's van onze experimenten zijn te vinden op https://sites.google.com/view/agile-catching.
English
We address a benchmark task in agile robotics: catching objects thrown at high-speed. This is a challenging task that involves tracking, intercepting, and cradling a thrown object with access only to visual observations of the object and the proprioceptive state of the robot, all within a fraction of a second. We present the relative merits of two fundamentally different solution strategies: (i) Model Predictive Control using accelerated constrained trajectory optimization, and (ii) Reinforcement Learning using zeroth-order optimization. We provide insights into various performance trade-offs including sample efficiency, sim-to-real transfer, robustness to distribution shifts, and whole-body multimodality via extensive on-hardware experiments. We conclude with proposals on fusing "classical" and "learning-based" techniques for agile robot control. Videos of our experiments may be found at https://sites.google.com/view/agile-catching
PDF81February 7, 2026