Tennis da tavolo robotico: uno studio di caso su un sistema di apprendimento ad alta velocità

Abstract

Presentiamo un'analisi approfondita di un sistema di apprendimento robotico del mondo reale che, in lavori precedenti, ha dimostrato di essere in grado di eseguire centinaia di scambi di ping pong con un essere umano e di restituire con precisione la palla a bersagli desiderati. Questo sistema combina un sottosistema di percezione altamente ottimizzato, un controller robotico ad alta velocità e bassa latenza, un paradigma di simulazione che può prevenire danni nel mondo reale e addestrare politiche per il trasferimento zero-shot, e reset automatici dell'ambiente reale che consentono l'addestramento e la valutazione autonoma su robot fisici. Integriamo una descrizione completa del sistema, includendo numerose decisioni progettuali che tipicamente non vengono ampiamente divulgate, con una raccolta di studi che chiariscono l'importanza di mitigare varie fonti di latenza, tenere conto degli spostamenti delle distribuzioni durante l'addestramento e il dispiegamento, la robustezza del sistema di percezione, la sensibilità agli iperparametri delle politiche e la scelta dello spazio delle azioni. Un video che dimostra i componenti del sistema e i dettagli dei risultati sperimentali è disponibile all'indirizzo https://youtu.be/uFcnWjB42I0.

English

We present a deep-dive into a real-world robotic learning system that, in previous work, was shown to be capable of hundreds of table tennis rallies with a human and has the ability to precisely return the ball to desired targets. This system puts together a highly optimized perception subsystem, a high-speed low-latency robot controller, a simulation paradigm that can prevent damage in the real world and also train policies for zero-shot transfer, and automated real world environment resets that enable autonomous training and evaluation on physical robots. We complement a complete system description, including numerous design decisions that are typically not widely disseminated, with a collection of studies that clarify the importance of mitigating various sources of latency, accounting for training and deployment distribution shifts, robustness of the perception system, sensitivity to policy hyper-parameters, and choice of action space. A video demonstrating the components of the system and details of experimental results can be found at https://youtu.be/uFcnWjB42I0.

Tennis da tavolo robotico: uno studio di caso su un sistema di apprendimento ad alta velocità

Robotic Table Tennis: A Case Study into a High Speed Learning System

Abstract

Support