ChatPaper.aiChatPaper

Tenis de Mesa Robótico: Un Estudio de Caso sobre un Sistema de Aprendizaje de Alta Velocidad

Robotic Table Tennis: A Case Study into a High Speed Learning System

September 6, 2023
Autores: David B. D'Ambrosio, Jonathan Abelian, Saminda Abeyruwan, Michael Ahn, Alex Bewley, Justin Boyd, Krzysztof Choromanski, Omar Cortes, Erwin Coumans, Tianli Ding, Wenbo Gao, Laura Graesser, Atil Iscen, Navdeep Jaitly, Deepali Jain, Juhana Kangaspunta, Satoshi Kataoka, Gus Kouretas, Yuheng Kuang, Nevena Lazic, Corey Lynch, Reza Mahjourian, Sherry Q. Moore, Thinh Nguyen, Ken Oslund, Barney J Reed, Krista Reymann, Pannag R. Sanketi, Anish Shankar, Pierre Sermanet, Vikas Sindhwani, Avi Singh, Vincent Vanhoucke, Grace Vesom, Peng Xu
cs.AI

Resumen

Presentamos un análisis en profundidad de un sistema de aprendizaje robótico del mundo real que, en trabajos previos, demostró ser capaz de realizar cientos de intercambios de tenis de mesa con un humano y tiene la capacidad de devolver la pelota con precisión a objetivos deseados. Este sistema combina un subsistema de percepción altamente optimizado, un controlador robótico de alta velocidad y baja latencia, un paradigma de simulación que puede prevenir daños en el mundo real y también entrenar políticas para transferencia de cero disparos, y reinicios automatizados del entorno en el mundo real que permiten el entrenamiento y evaluación autónomos en robots físicos. Complementamos una descripción completa del sistema, incluyendo numerosas decisiones de diseño que normalmente no se divulgan ampliamente, con una colección de estudios que aclaran la importancia de mitigar diversas fuentes de latencia, tener en cuenta los cambios de distribución entre el entrenamiento y el despliegue, la robustez del sistema de percepción, la sensibilidad a los hiperparámetros de la política y la elección del espacio de acción. Un video que demuestra los componentes del sistema y los detalles de los resultados experimentales se puede encontrar en https://youtu.be/uFcnWjB42I0.
English
We present a deep-dive into a real-world robotic learning system that, in previous work, was shown to be capable of hundreds of table tennis rallies with a human and has the ability to precisely return the ball to desired targets. This system puts together a highly optimized perception subsystem, a high-speed low-latency robot controller, a simulation paradigm that can prevent damage in the real world and also train policies for zero-shot transfer, and automated real world environment resets that enable autonomous training and evaluation on physical robots. We complement a complete system description, including numerous design decisions that are typically not widely disseminated, with a collection of studies that clarify the importance of mitigating various sources of latency, accounting for training and deployment distribution shifts, robustness of the perception system, sensitivity to policy hyper-parameters, and choice of action space. A video demonstrating the components of the system and details of experimental results can be found at https://youtu.be/uFcnWjB42I0.
PDF70December 15, 2024