ChatPaper.aiChatPaper

Robotisch Tafeltennis: Een Casestudy naar een Hoogwaardig Leersysteem voor Hoge Snelheden

Robotic Table Tennis: A Case Study into a High Speed Learning System

September 6, 2023
Auteurs: David B. D'Ambrosio, Jonathan Abelian, Saminda Abeyruwan, Michael Ahn, Alex Bewley, Justin Boyd, Krzysztof Choromanski, Omar Cortes, Erwin Coumans, Tianli Ding, Wenbo Gao, Laura Graesser, Atil Iscen, Navdeep Jaitly, Deepali Jain, Juhana Kangaspunta, Satoshi Kataoka, Gus Kouretas, Yuheng Kuang, Nevena Lazic, Corey Lynch, Reza Mahjourian, Sherry Q. Moore, Thinh Nguyen, Ken Oslund, Barney J Reed, Krista Reymann, Pannag R. Sanketi, Anish Shankar, Pierre Sermanet, Vikas Sindhwani, Avi Singh, Vincent Vanhoucke, Grace Vesom, Peng Xu
cs.AI

Samenvatting

We presenteren een diepgaande analyse van een real-world robotisch leersysteem dat in eerder werk het vermogen heeft getoond om honderden tafeltennisrally's met een mens uit te voeren en de bal nauwkeurig naar gewenste doelen terug te kunnen spelen. Dit systeem combineert een sterk geoptimaliseerd waarnemingssubsysteem, een hoogwaardige robotcontroller met lage latentie, een simulatieparadigma dat schade in de echte wereld kan voorkomen en ook beleidsregels kan trainen voor zero-shot transfer, en geautomatiseerde resets van de echte wereld omgeving die autonome training en evaluatie op fysieke robots mogelijk maken. We vullen een volledige systeembeschrijving aan, inclusief tal van ontwerpbeslissingen die doorgaans niet breed worden verspreid, met een reeks studies die het belang verduidelijken van het beperken van verschillende bronnen van latentie, het rekening houden met verschuivingen in trainings- en implementatiedistributies, de robuustheid van het waarnemingssysteem, de gevoeligheid voor beleidshyperparameters en de keuze van de actieruimte. Een video die de componenten van het systeem en details van de experimentele resultaten demonstreert, is te vinden op https://youtu.be/uFcnWjB42I0.
English
We present a deep-dive into a real-world robotic learning system that, in previous work, was shown to be capable of hundreds of table tennis rallies with a human and has the ability to precisely return the ball to desired targets. This system puts together a highly optimized perception subsystem, a high-speed low-latency robot controller, a simulation paradigm that can prevent damage in the real world and also train policies for zero-shot transfer, and automated real world environment resets that enable autonomous training and evaluation on physical robots. We complement a complete system description, including numerous design decisions that are typically not widely disseminated, with a collection of studies that clarify the importance of mitigating various sources of latency, accounting for training and deployment distribution shifts, robustness of the perception system, sensitivity to policy hyper-parameters, and choice of action space. A video demonstrating the components of the system and details of experimental results can be found at https://youtu.be/uFcnWjB42I0.
PDF70December 15, 2024