LoGoPlanner: Política de Navegación Basada en Localización con Geometría Visual Consciente de la Métrica
LoGoPlanner: Localization Grounded Navigation Policy with Metric-aware Visual Geometry
December 22, 2025
Autores: Jiaqi Peng, Wenzhe Cai, Yuqiang Yang, Tai Wang, Yuan Shen, Jiangmiao Pang
cs.AI
Resumen
La planificación de trayectorias en entornos no estructurados es una capacidad fundamental y desafiante para los robots móviles. Los enfoques modulares tradicionales adolecen de latencia y errores en cascada entre los módulos de percepción, localización, cartografía y planificación. Los métodos recientes de aprendizaje end-to-end mapean observaciones visuales directamente a señales de control o trayectorias, prometiendo mayor rendimiento y eficiencia en entornos de mundo abierto. Sin embargo, la mayoría de los enfoques end-to-end previos aún dependen de módulos de localización separados que requieren una calibración extrínseca precisa de los sensores para la estimación del estado propio, limitando así la generalización entre diferentes configuraciones robóticas y entornos. Presentamos LoGoPlanner, un marco de navegación end-to-end basado en localización que aborda estas limitaciones mediante: (1) el ajuste fino de un modelo base visual-geométrico de largo horizonte para fundamentar las predicciones con escala métrica absoluta, proporcionando así una estimación de estado implícita para una localización precisa; (2) la reconstrucción de la geometría circundante de la escena a partir de observaciones históricas para proporcionar una conciencia ambiental densa y granular para una evitación de obstáculos fiable; y (3) la condicionamiento de la política de control en geometría implícita inicializada por las tareas auxiliares antes mencionadas, reduciendo así la propagación de errores. Evaluamos LoGoPlanner tanto en entornos de simulación como del mundo real, donde su diseño completamente end-to-end reduce el error acumulativo, mientras que la memoria geométrica con conciencia métrica mejora la consistencia de la planificación y la evitación de obstáculos, logrando una mejora superior al 27.3% respecto a líneas base con localización idealizada y una fuerte generalización entre configuraciones robóticas y entornos. El código y los modelos han sido puestos a disposición del público en la {página del proyecto} https://steinate.github.io/logoplanner.github.io/.
English
Trajectory planning in unstructured environments is a fundamental and challenging capability for mobile robots. Traditional modular pipelines suffer from latency and cascading errors across perception, localization, mapping, and planning modules. Recent end-to-end learning methods map raw visual observations directly to control signals or trajectories, promising greater performance and efficiency in open-world settings. However, most prior end-to-end approaches still rely on separate localization modules that depend on accurate sensor extrinsic calibration for self-state estimation, thereby limiting generalization across embodiments and environments. We introduce LoGoPlanner, a localization-grounded, end-to-end navigation framework that addresses these limitations by: (1) finetuning a long-horizon visual-geometry backbone to ground predictions with absolute metric scale, thereby providing implicit state estimation for accurate localization; (2) reconstructing surrounding scene geometry from historical observations to supply dense, fine-grained environmental awareness for reliable obstacle avoidance; and (3) conditioning the policy on implicit geometry bootstrapped by the aforementioned auxiliary tasks, thereby reducing error propagation.We evaluate LoGoPlanner in both simulation and real-world settings, where its fully end-to-end design reduces cumulative error while metric-aware geometry memory enhances planning consistency and obstacle avoidance, leading to more than a 27.3\% improvement over oracle-localization baselines and strong generalization across embodiments and environments. The code and models have been made publicly available on the https://steinate.github.io/logoplanner.github.io/{project page}.