ChatPaper.aiChatPaper

DROID-SLAM en Entornos Naturales

DROID-SLAM in the Wild

March 19, 2026
Autores: Moyang Li, Zihan Zhu, Marc Pollefeys, Daniel Barath
cs.AI

Resumen

Presentamos un sistema robusto de SLAM RGB en tiempo real que maneja entornos dinámicos mediante el uso de Ajuste de Haz con Conciencia de la Incertidumbre diferenciable. Los métodos tradicionales de SLAM suelen asumir escenas estáticas, lo que provoca fallos en el seguimiento ante la presencia de movimiento. Los enfoques recientes de SLAM dinámico intentan abordar este desafío utilizando prerrequisitos dinámicos predefinidos o cartografía con conciencia de la incertidumbre, pero siguen siendo limitados cuando se enfrentan a objetos dinámicos desconocidos o escenas altamente desordenadas donde la cartografía geométrica se vuelve poco fiable. En contraste, nuestro método estima la incertidumbre por píxel explotando la inconsistencia de características visuales multi-vista, permitiendo un seguimiento y reconstrucción robustos incluso en entornos del mundo real. El sistema propuesto logra poses de cámara y geometría de escena de vanguardia en escenarios dinámicos desordenados, mientras funciona en tiempo real a aproximadamente 10 FPS. El código y los conjuntos de datos están disponibles en https://github.com/MoyangLi00/DROID-W.git.
English
We present a robust, real-time RGB SLAM system that handles dynamic environments by leveraging differentiable Uncertainty-aware Bundle Adjustment. Traditional SLAM methods typically assume static scenes, leading to tracking failures in the presence of motion. Recent dynamic SLAM approaches attempt to address this challenge using predefined dynamic priors or uncertainty-aware mapping, but they remain limited when confronted with unknown dynamic objects or highly cluttered scenes where geometric mapping becomes unreliable. In contrast, our method estimates per-pixel uncertainty by exploiting multi-view visual feature inconsistency, enabling robust tracking and reconstruction even in real-world environments. The proposed system achieves state-of-the-art camera poses and scene geometry in cluttered dynamic scenarios while running in real time at around 10 FPS. Code and datasets are available at https://github.com/MoyangLi00/DROID-W.git.
PDF31March 24, 2026