ChatPaper.aiChatPaper

Manipulação Humanóide Generalizável com Políticas de Difusão 3D Aprimoradas

Generalizable Humanoid Manipulation with Improved 3D Diffusion Policies

October 14, 2024
Autores: Yanjie Ze, Zixuan Chen, Wenhao Wang, Tianyi Chen, Xialin He, Ying Yuan, Xue Bin Peng, Jiajun Wu
cs.AI

Resumo

Robôs humanoides capazes de operação autônoma em ambientes diversos têm sido há muito tempo um objetivo para os roboticistas. No entanto, a manipulação autônoma por robôs humanoides tem sido amplamente restrita a uma cena específica, principalmente devido à dificuldade de adquirir habilidades generalizáveis. Avanços recentes em políticas visuomotoras 3D, como a Política de Difusão 3D (DP3), têm demonstrado promessa em estender essas capacidades para ambientes mais selvagens. No entanto, as políticas visuomotoras 3D frequentemente dependem da calibração da câmera e da segmentação de nuvem de pontos, o que apresenta desafios para implantação em robôs móveis como os humanoides. Neste trabalho, apresentamos a Política de Difusão 3D Melhorada (iDP3), uma nova política visuomotora 3D que elimina essas restrições ao alavancar representações visuais 3D egocêntricas. Demonstramos que o iDP3 permite que um robô humanoide em tamanho real execute autonomamente habilidades em diversos cenários do mundo real, usando apenas dados coletados no laboratório. Vídeos estão disponíveis em: https://humanoid-manipulation.github.io
English
Humanoid robots capable of autonomous operation in diverse environments have long been a goal for roboticists. However, autonomous manipulation by humanoid robots has largely been restricted to one specific scene, primarily due to the difficulty of acquiring generalizable skills. Recent advances in 3D visuomotor policies, such as the 3D Diffusion Policy (DP3), have shown promise in extending these capabilities to wilder environments. However, 3D visuomotor policies often rely on camera calibration and point-cloud segmentation, which present challenges for deployment on mobile robots like humanoids. In this work, we introduce the Improved 3D Diffusion Policy (iDP3), a novel 3D visuomotor policy that eliminates these constraints by leveraging egocentric 3D visual representations. We demonstrate that iDP3 enables a full-sized humanoid robot to autonomously perform skills in diverse real-world scenarios, using only data collected in the lab. Videos are available at: https://humanoid-manipulation.github.io

Summary

AI-Generated Summary

PDF72November 16, 2024