ChatPaper.aiChatPaper

DROID-SLAM en Milieu Naturel

DROID-SLAM in the Wild

March 19, 2026
Auteurs: Moyang Li, Zihan Zhu, Marc Pollefeys, Daniel Barath
cs.AI

Résumé

Nous présentons un système RGB SLAM robuste et temps réel qui gère les environnements dynamiques en exploitant un ajustement de faisceaux différenciable et conscient de l'incertitude. Les méthodes SLAM traditionnelles supposent généralement des scènes statiques, ce qui entraîne des échecs de suivi en présence de mouvement. Les approches SLAM dynamiques récentes tentent de relever ce défi en utilisant des préalables dynamiques prédéfinis ou une cartographie sensible à l'incertitude, mais elles restent limitées face à des objets dynamiques inconnus ou des scènes très encombrées où la cartographie géométrique devient peu fiable. En revanche, notre méthode estime l'incertitude par pixel en exploitant l'incohérence des caractéristiques visuelles multi-vues, permettant un suivi et une reconstruction robustes même dans des environnements réels. Le système proposé atteint des poses de caméra et une géométrie de scène à l'état de l'art dans des scénarios dynamiques encombrés tout en fonctionnant en temps réel à environ 10 images par seconde. Le code et les jeux de données sont disponibles à l'adresse https://github.com/MoyangLi00/DROID-W.git.
English
We present a robust, real-time RGB SLAM system that handles dynamic environments by leveraging differentiable Uncertainty-aware Bundle Adjustment. Traditional SLAM methods typically assume static scenes, leading to tracking failures in the presence of motion. Recent dynamic SLAM approaches attempt to address this challenge using predefined dynamic priors or uncertainty-aware mapping, but they remain limited when confronted with unknown dynamic objects or highly cluttered scenes where geometric mapping becomes unreliable. In contrast, our method estimates per-pixel uncertainty by exploiting multi-view visual feature inconsistency, enabling robust tracking and reconstruction even in real-world environments. The proposed system achieves state-of-the-art camera poses and scene geometry in cluttered dynamic scenarios while running in real time at around 10 FPS. Code and datasets are available at https://github.com/MoyangLi00/DROID-W.git.
PDF31March 24, 2026