ChatPaper.aiChatPaper

GMT: 휴머노이드 전신 제어를 위한 일반적 동작 추적

GMT: General Motion Tracking for Humanoid Whole-Body Control

June 17, 2025
저자: Zixuan Chen, Mazeyu Ji, Xuxin Cheng, Xuanbin Peng, Xue Bin Peng, Xiaolong Wang
cs.AI

초록

실제 세계에서 일반적인 전신 동작을 추적할 수 있는 능력은 범용 휴머노이드 로봇을 구축하는 데 유용한 방법입니다. 그러나 이를 달성하는 것은 동작의 시간적 및 운동학적 다양성, 정책의 능력, 그리고 상체와 하체의 조정 어려움으로 인해 도전적일 수 있습니다. 이러한 문제를 해결하기 위해, 우리는 GMT라는 일반적이고 확장 가능한 동작 추적 프레임워크를 제안합니다. GMT는 단일 통합 정책을 훈련시켜 휴머노이드 로봇이 실제 세계에서 다양한 동작을 추적할 수 있도록 합니다. GMT는 두 가지 핵심 구성 요소인 적응형 샘플링 전략과 동작 전문가 혼합(Motion Mixture-of-Experts, MoE) 아키텍처를 기반으로 구축되었습니다. 적응형 샘플링은 훈련 중 쉬운 동작과 어려운 동작을 자동으로 균형 있게 조정합니다. MoE는 동작 다양체의 다른 영역에 대한 더 나은 전문화를 보장합니다. 우리는 시뮬레이션과 실제 세계에서의 광범위한 실험을 통해 GMT의 효과를 입증하며, 통합된 일반 정책을 사용하여 다양한 동작에 걸쳐 최첨단 성능을 달성합니다. 비디오 및 추가 정보는 https://gmt-humanoid.github.io에서 확인할 수 있습니다.
English
The ability to track general whole-body motions in the real world is a useful way to build general-purpose humanoid robots. However, achieving this can be challenging due to the temporal and kinematic diversity of the motions, the policy's capability, and the difficulty of coordination of the upper and lower bodies. To address these issues, we propose GMT, a general and scalable motion-tracking framework that trains a single unified policy to enable humanoid robots to track diverse motions in the real world. GMT is built upon two core components: an Adaptive Sampling strategy and a Motion Mixture-of-Experts (MoE) architecture. The Adaptive Sampling automatically balances easy and difficult motions during training. The MoE ensures better specialization of different regions of the motion manifold. We show through extensive experiments in both simulation and the real world the effectiveness of GMT, achieving state-of-the-art performance across a broad spectrum of motions using a unified general policy. Videos and additional information can be found at https://gmt-humanoid.github.io.
PDF32June 19, 2025