ChatPaper.aiChatPaper

SkillBlender: Hacia la Manipulación Locomotora Versátil de Cuerpo Completo en Humanoides mediante la Fusión de Habilidades

SkillBlender: Towards Versatile Humanoid Whole-Body Loco-Manipulation via Skill Blending

June 11, 2025
Autores: Yuxuan Kuang, Haoran Geng, Amine Elhafsi, Tan-Dzung Do, Pieter Abbeel, Jitendra Malik, Marco Pavone, Yue Wang
cs.AI

Resumen

Los robots humanoides tienen un potencial significativo para realizar tareas cotidianas en diversos entornos gracias a su flexibilidad y morfología similar a la humana. Trabajos recientes han logrado avances importantes en el control de cuerpo completo y la locomoción-manipulación de humanoides, aprovechando el control óptimo o el aprendizaje por refuerzo. Sin embargo, estos métodos requieren un ajuste tedioso y específico para cada tarea para lograr comportamientos satisfactorios, lo que limita su versatilidad y escalabilidad en diversas tareas de escenarios cotidianos. Con este fin, presentamos SkillBlender, un novedoso marco de aprendizaje por refuerzo jerárquico para la locomoción-manipulación versátil de humanoides. SkillBlender primero entrena habilidades primitivas agnósticas a la tarea condicionadas por objetivos, y luego combina dinámicamente estas habilidades para realizar tareas complejas de locomoción-manipulación con una ingeniería de recompensas específica para la tarea mínima. También presentamos SkillBench, un punto de referencia simulado paralelo, de encarnación cruzada y diverso que contiene tres encarnaciones, cuatro habilidades primitivas y ocho tareas desafiantes de locomoción-manipulación, acompañado de un conjunto de métricas de evaluación científica que equilibran precisión y viabilidad. Experimentos simulados extensos muestran que nuestro método supera significativamente a todas las líneas base, mientras regula naturalmente los comportamientos para evitar el hackeo de recompensas, lo que resulta en movimientos más precisos y viables para diversas tareas de locomoción-manipulación en nuestros escenarios cotidianos. Nuestro código y punto de referencia se pondrán a disposición de la comunidad para facilitar futuras investigaciones. Página del proyecto: https://usc-gvl.github.io/SkillBlender-web/.
English
Humanoid robots hold significant potential in accomplishing daily tasks across diverse environments thanks to their flexibility and human-like morphology. Recent works have made significant progress in humanoid whole-body control and loco-manipulation leveraging optimal control or reinforcement learning. However, these methods require tedious task-specific tuning for each task to achieve satisfactory behaviors, limiting their versatility and scalability to diverse tasks in daily scenarios. To that end, we introduce SkillBlender, a novel hierarchical reinforcement learning framework for versatile humanoid loco-manipulation. SkillBlender first pretrains goal-conditioned task-agnostic primitive skills, and then dynamically blends these skills to accomplish complex loco-manipulation tasks with minimal task-specific reward engineering. We also introduce SkillBench, a parallel, cross-embodiment, and diverse simulated benchmark containing three embodiments, four primitive skills, and eight challenging loco-manipulation tasks, accompanied by a set of scientific evaluation metrics balancing accuracy and feasibility. Extensive simulated experiments show that our method significantly outperforms all baselines, while naturally regularizing behaviors to avoid reward hacking, resulting in more accurate and feasible movements for diverse loco-manipulation tasks in our daily scenarios. Our code and benchmark will be open-sourced to the community to facilitate future research. Project page: https://usc-gvl.github.io/SkillBlender-web/.
PDF62June 16, 2025