ChatPaper.aiChatPaper

공을 굴리기: 롤링 접촉 관절을 가진 생체모방 텐던 구동 손의 정교한 제어 정책 학습

Getting the Ball Rolling: Learning a Dexterous Policy for a Biomimetic Tendon-Driven Hand with Rolling Contact Joints

August 4, 2023
저자: Yasunori Toshimitsu, Benedek Forrai, Barnabas Gavin Cangan, Ulrich Steger, Manuel Knecht, Stefan Weirich, Robert K. Katzschmann
cs.AI

초록

생체모방적이고 민첩한 로봇 손은 인간이 수행할 수 있는 다양한 작업을 복제하고, 일반적인 조작 플랫폼으로서의 지위를 달성할 잠재력을 가지고 있다. 최근 강화학습(Reinforcement Learning, RL) 프레임워크의 발전은 사족 보행과 민첩한 조작 작업에서 뛰어난 성능을 달성하였다. GPU 기반의 고도로 병렬화된 시뮬레이션과 결합되어 수천 대의 로봇을 동시에 시뮬레이션할 수 있는 능력 덕분에, RL 기반 제어기는 더 확장 가능하고 접근 가능해졌다. 그러나 RL로 훈련된 정책을 실제 세계에 적용하기 위해서는 물리적 액추에이터와 센서와 호환되는 정책을 출력할 수 있는 훈련 프레임워크와, 접근 가능한 재료로 제조되면서도 상호작용 정책을 실행할 수 있을 만큼 견고한 하드웨어 플랫폼이 필요하다. 본 연구는 생체모방적인 텐던 구동 방식의 Faive Hand와 그 시스템 아키텍처를 소개하며, 이는 텐던 구동 롤링 접촉 관절을 사용하여 3D 프린팅 가능하고 견고한 고자유도(high-DoF) 손 설계를 달성한다. 우리는 손의 각 요소를 모델링하고 GPU 시뮬레이션 환경에 통합하여 RL로 정책을 훈련시키며, 민첩한 손 내 구체 회전 기술을 물리적 로봇 손으로 제로샷 전이(zero-shot transfer)를 달성한다.
English
Biomimetic, dexterous robotic hands have the potential to replicate much of the tasks that a human can do, and to achieve status as a general manipulation platform. Recent advances in reinforcement learning (RL) frameworks have achieved remarkable performance in quadrupedal locomotion and dexterous manipulation tasks. Combined with GPU-based highly parallelized simulations capable of simulating thousands of robots in parallel, RL-based controllers have become more scalable and approachable. However, in order to bring RL-trained policies to the real world, we require training frameworks that output policies that can work with physical actuators and sensors as well as a hardware platform that can be manufactured with accessible materials yet is robust enough to run interactive policies. This work introduces the biomimetic tendon-driven Faive Hand and its system architecture, which uses tendon-driven rolling contact joints to achieve a 3D printable, robust high-DoF hand design. We model each element of the hand and integrate it into a GPU simulation environment to train a policy with RL, and achieve zero-shot transfer of a dexterous in-hand sphere rotation skill to the physical robot hand.
PDF90December 15, 2024