ChatPaper.aiChatPaper

SkillBlender: Naar veelzijdige loco-manipulatie van het hele lichaam bij humanoïden via vaardigheidsintegratie

SkillBlender: Towards Versatile Humanoid Whole-Body Loco-Manipulation via Skill Blending

June 11, 2025
Auteurs: Yuxuan Kuang, Haoran Geng, Amine Elhafsi, Tan-Dzung Do, Pieter Abbeel, Jitendra Malik, Marco Pavone, Yue Wang
cs.AI

Samenvatting

Humanoïde robots hebben aanzienlijk potentieel in het uitvoeren van dagelijkse taken in diverse omgevingen dankzij hun flexibiliteit en mensachtige morfologie. Recente werken hebben aanzienlijke vooruitgang geboekt in het hele-lichaam besturen van humanoïde robots en loco-manipulatie door gebruik te maken van optimale controle of reinforcement learning. Deze methoden vereisen echter tijdrovende, taakspecifieke afstemming voor elke taak om bevredigend gedrag te bereiken, wat hun veelzijdigheid en schaalbaarheid voor diverse taken in dagelijkse scenario's beperkt. Daarom introduceren we SkillBlender, een nieuw hiërarchisch reinforcement learning raamwerk voor veelzijdige humanoïde loco-manipulatie. SkillBlender traint eerst doelgerichte, taakongevoelige primitieve vaardigheden voor, en combineert deze vaardigheden vervolgens dynamisch om complexe loco-manipulatietaken uit te voeren met minimale taakspecifieke beloningsengineering. We introduceren ook SkillBench, een parallelle, cross-embodiment en diverse gesimuleerde benchmark met drie embodiementen, vier primitieve vaardigheden en acht uitdagende loco-manipulatietaken, vergezeld van een set wetenschappelijke evaluatiemetrics die nauwkeurigheid en haalbaarheid in balans brengen. Uitgebreide gesimuleerde experimenten tonen aan dat onze methode alle referentiemethoden significant overtreft, terwijl het gedrag op natuurlijke wijze wordt gereguleerd om beloningsmanipulatie te voorkomen, wat resulteert in nauwkeurigere en haalbare bewegingen voor diverse loco-manipulatietaken in onze dagelijkse scenario's. Onze code en benchmark zullen worden openbaar gemaakt voor de gemeenschap om toekomstig onderzoek te faciliteren. Projectpagina: https://usc-gvl.github.io/SkillBlender-web/.
English
Humanoid robots hold significant potential in accomplishing daily tasks across diverse environments thanks to their flexibility and human-like morphology. Recent works have made significant progress in humanoid whole-body control and loco-manipulation leveraging optimal control or reinforcement learning. However, these methods require tedious task-specific tuning for each task to achieve satisfactory behaviors, limiting their versatility and scalability to diverse tasks in daily scenarios. To that end, we introduce SkillBlender, a novel hierarchical reinforcement learning framework for versatile humanoid loco-manipulation. SkillBlender first pretrains goal-conditioned task-agnostic primitive skills, and then dynamically blends these skills to accomplish complex loco-manipulation tasks with minimal task-specific reward engineering. We also introduce SkillBench, a parallel, cross-embodiment, and diverse simulated benchmark containing three embodiments, four primitive skills, and eight challenging loco-manipulation tasks, accompanied by a set of scientific evaluation metrics balancing accuracy and feasibility. Extensive simulated experiments show that our method significantly outperforms all baselines, while naturally regularizing behaviors to avoid reward hacking, resulting in more accurate and feasible movements for diverse loco-manipulation tasks in our daily scenarios. Our code and benchmark will be open-sourced to the community to facilitate future research. Project page: https://usc-gvl.github.io/SkillBlender-web/.
PDF82June 16, 2025