ChatPaper.aiChatPaper

ロボット卓球:高速学習システムの事例研究

Robotic Table Tennis: A Case Study into a High Speed Learning System

September 6, 2023
著者: David B. D'Ambrosio, Jonathan Abelian, Saminda Abeyruwan, Michael Ahn, Alex Bewley, Justin Boyd, Krzysztof Choromanski, Omar Cortes, Erwin Coumans, Tianli Ding, Wenbo Gao, Laura Graesser, Atil Iscen, Navdeep Jaitly, Deepali Jain, Juhana Kangaspunta, Satoshi Kataoka, Gus Kouretas, Yuheng Kuang, Nevena Lazic, Corey Lynch, Reza Mahjourian, Sherry Q. Moore, Thinh Nguyen, Ken Oslund, Barney J Reed, Krista Reymann, Pannag R. Sanketi, Anish Shankar, Pierre Sermanet, Vikas Sindhwani, Avi Singh, Vincent Vanhoucke, Grace Vesom, Peng Xu
cs.AI

要旨

我々は、過去の研究において人間との間で数百回の卓球ラリーを可能にし、ボールを所望のターゲットに正確に返す能力を有することが示された実世界のロボット学習システムについて、詳細な分析を提示する。このシステムは、高度に最適化された知覚サブシステム、高速で低遅延のロボット制御装置、現実世界での損傷を防ぎつつゼロショット転移のためのポリシーを訓練できるシミュレーションパラダイム、そして物理ロボット上での自律的な訓練と評価を可能にする自動化された現実世界環境リセットを統合している。我々は、通常広く公開されない数多くの設計決定を含む完全なシステム記述に加えて、様々な遅延源の軽減の重要性、訓練と展開の分布シフトの考慮、知覚システムの堅牢性、ポリシーハイパーパラメータに対する感度、およびアクション空間の選択を明らかにする一連の研究を補完する。システムの構成要素と実験結果の詳細を示すビデオは、https://youtu.be/uFcnWjB42I0 で閲覧可能である。
English
We present a deep-dive into a real-world robotic learning system that, in previous work, was shown to be capable of hundreds of table tennis rallies with a human and has the ability to precisely return the ball to desired targets. This system puts together a highly optimized perception subsystem, a high-speed low-latency robot controller, a simulation paradigm that can prevent damage in the real world and also train policies for zero-shot transfer, and automated real world environment resets that enable autonomous training and evaluation on physical robots. We complement a complete system description, including numerous design decisions that are typically not widely disseminated, with a collection of studies that clarify the importance of mitigating various sources of latency, accounting for training and deployment distribution shifts, robustness of the perception system, sensitivity to policy hyper-parameters, and choice of action space. A video demonstrating the components of the system and details of experimental results can be found at https://youtu.be/uFcnWjB42I0.
PDF70December 15, 2024