ChatPaper.aiChatPaper

Any6D : Estimation de pose 6D sans modèle pour des objets nouveaux

Any6D: Model-free 6D Pose Estimation of Novel Objects

March 24, 2025
Auteurs: Taeyeop Lee, Bowen Wen, Minjun Kang, Gyuree Kang, In So Kweon, Kuk-Jin Yoon
cs.AI

Résumé

Nous présentons Any6D, un cadre sans modèle pour l'estimation de pose 6D d'objets qui ne nécessite qu'une seule image d'ancrage RGB-D pour estimer à la fois la pose 6D et la taille d'objets inconnus dans de nouvelles scènes. Contrairement aux méthodes existantes qui s'appuient sur des modèles 3D texturés ou des vues multiples, Any6D exploite un processus d'alignement conjoint d'objets pour améliorer l'alignement 2D-3D et l'estimation de l'échelle métrique, permettant ainsi une précision accrue de la pose. Notre approche intègre une stratégie de rendu et comparaison pour générer et affiner des hypothèses de pose, offrant une performance robuste dans des scénarios comportant des occlusions, des vues non chevauchantes, des conditions d'éclairage variées et de grandes variations inter-environnementales. Nous évaluons notre méthode sur cinq ensembles de données complexes : REAL275, Toyota-Light, HO3D, YCBINEOAT et LM-O, démontrant son efficacité à surpasser significativement les méthodes de pointe pour l'estimation de pose d'objets inconnus. Page du projet : https://taeyeop.com/any6d
English
We introduce Any6D, a model-free framework for 6D object pose estimation that requires only a single RGB-D anchor image to estimate both the 6D pose and size of unknown objects in novel scenes. Unlike existing methods that rely on textured 3D models or multiple viewpoints, Any6D leverages a joint object alignment process to enhance 2D-3D alignment and metric scale estimation for improved pose accuracy. Our approach integrates a render-and-compare strategy to generate and refine pose hypotheses, enabling robust performance in scenarios with occlusions, non-overlapping views, diverse lighting conditions, and large cross-environment variations. We evaluate our method on five challenging datasets: REAL275, Toyota-Light, HO3D, YCBINEOAT, and LM-O, demonstrating its effectiveness in significantly outperforming state-of-the-art methods for novel object pose estimation. Project page: https://taeyeop.com/any6d

Summary

AI-Generated Summary

PDF32March 27, 2025