ChatPaper.aiChatPaper

Aprendizado por Reforço de Simulação para Realidade para Manipulação Habilidosa Baseada em Visão em Humanoides

Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids

February 27, 2025
Autores: Toru Lin, Kartik Sachdev, Linxi Fan, Jitendra Malik, Yuke Zhu
cs.AI

Resumo

O aprendizado por reforço tem apresentado resultados promissores ao alcançar capacidades em nível humano ou até super-humano em diversos domínios de problemas, mas o sucesso na manipulação ágil por robôs ainda é limitado. Este trabalho investiga os principais desafios na aplicação do aprendizado por reforço para resolver uma coleção de tarefas de manipulação ricas em contato em uma plataforma humanóide. Introduzimos técnicas inovadoras para superar os desafios identificados, com validação empírica. Nossas principais contribuições incluem um módulo automatizado de ajuste de simulação para realidade que aproxima o ambiente simulado do mundo real, um esquema generalizado de design de recompensas que simplifica a engenharia de recompensas para tarefas de manipulação ricas em contato de longo horizonte, um processo de destilação de divisão e conquista que melhora a eficiência de amostragem em problemas de exploração difícil enquanto mantém o desempenho de simulação para realidade, e uma mistura de representações esparsas e densas de objetos para reduzir a lacuna de percepção entre simulação e realidade. Mostramos resultados promissores em três tarefas de manipulação ágil com humanóides, com estudos de ablação para cada técnica. Nosso trabalho apresenta uma abordagem bem-sucedida para o aprendizado de manipulação ágil com humanóides usando aprendizado por reforço de simulação para realidade, alcançando generalização robusta e alto desempenho sem a necessidade de demonstração humana.
English
Reinforcement learning has delivered promising results in achieving human- or even superhuman-level capabilities across diverse problem domains, but success in dexterous robot manipulation remains limited. This work investigates the key challenges in applying reinforcement learning to solve a collection of contact-rich manipulation tasks on a humanoid embodiment. We introduce novel techniques to overcome the identified challenges with empirical validation. Our main contributions include an automated real-to-sim tuning module that brings the simulated environment closer to the real world, a generalized reward design scheme that simplifies reward engineering for long-horizon contact-rich manipulation tasks, a divide-and-conquer distillation process that improves the sample efficiency of hard-exploration problems while maintaining sim-to-real performance, and a mixture of sparse and dense object representations to bridge the sim-to-real perception gap. We show promising results on three humanoid dexterous manipulation tasks, with ablation studies on each technique. Our work presents a successful approach to learning humanoid dexterous manipulation using sim-to-real reinforcement learning, achieving robust generalization and high performance without the need for human demonstration.

Summary

AI-Generated Summary

PDF162March 3, 2025