ChatPaper.aiChatPaper

Tennis de table robotique : Une étude de cas sur un système d'apprentissage à haute vitesse

Robotic Table Tennis: A Case Study into a High Speed Learning System

September 6, 2023
Auteurs: David B. D'Ambrosio, Jonathan Abelian, Saminda Abeyruwan, Michael Ahn, Alex Bewley, Justin Boyd, Krzysztof Choromanski, Omar Cortes, Erwin Coumans, Tianli Ding, Wenbo Gao, Laura Graesser, Atil Iscen, Navdeep Jaitly, Deepali Jain, Juhana Kangaspunta, Satoshi Kataoka, Gus Kouretas, Yuheng Kuang, Nevena Lazic, Corey Lynch, Reza Mahjourian, Sherry Q. Moore, Thinh Nguyen, Ken Oslund, Barney J Reed, Krista Reymann, Pannag R. Sanketi, Anish Shankar, Pierre Sermanet, Vikas Sindhwani, Avi Singh, Vincent Vanhoucke, Grace Vesom, Peng Xu
cs.AI

Résumé

Nous présentons une analyse approfondie d'un système d'apprentissage robotique en conditions réelles qui, dans des travaux précédents, a démontré sa capacité à réaliser des centaines d'échanges au tennis de table avec un humain et à renvoyer la balle avec précision vers des cibles spécifiques. Ce système intègre un sous-système de perception hautement optimisé, un contrôleur robotique à haute vitesse et faible latence, un paradigme de simulation permettant d'éviter les dommages dans le monde réel tout en entraînant des politiques pour un transfert sans adaptation (zero-shot), ainsi que des réinitialisations automatisées de l'environnement réel qui permettent un entraînement et une évaluation autonomes sur des robots physiques. Nous complétons une description complète du système, incluant de nombreuses décisions de conception généralement peu divulguées, par une série d'études clarifiant l'importance de réduire diverses sources de latence, de prendre en compte les décalages entre les distributions d'entraînement et de déploiement, la robustesse du système de perception, la sensibilité aux hyperparamètres des politiques, et le choix de l'espace d'action. Une vidéo démontrant les composants du système et les détails des résultats expérimentaux est disponible à l'adresse suivante : https://youtu.be/uFcnWjB42I0.
English
We present a deep-dive into a real-world robotic learning system that, in previous work, was shown to be capable of hundreds of table tennis rallies with a human and has the ability to precisely return the ball to desired targets. This system puts together a highly optimized perception subsystem, a high-speed low-latency robot controller, a simulation paradigm that can prevent damage in the real world and also train policies for zero-shot transfer, and automated real world environment resets that enable autonomous training and evaluation on physical robots. We complement a complete system description, including numerous design decisions that are typically not widely disseminated, with a collection of studies that clarify the importance of mitigating various sources of latency, accounting for training and deployment distribution shifts, robustness of the perception system, sensitivity to policy hyper-parameters, and choice of action space. A video demonstrating the components of the system and details of experimental results can be found at https://youtu.be/uFcnWjB42I0.
PDF70December 15, 2024