LoGoPlanner: Lokalisierungsbasierte Navigationsstrategie mit metrikbewusster visueller Geometrie
LoGoPlanner: Localization Grounded Navigation Policy with Metric-aware Visual Geometry
December 22, 2025
papers.authors: Jiaqi Peng, Wenzhe Cai, Yuqiang Yang, Tai Wang, Yuan Shen, Jiangmiao Pang
cs.AI
papers.abstract
Trajektorienplanung in unstrukturierten Umgebungen ist eine grundlegende und anspruchsvolle Fähigkeit für mobile Roboter. Traditionelle modulare Pipelines leiden unter Latenz und kaskadierenden Fehlern zwischen Wahrnehmungs-, Lokalisierungs-, Kartierungs- und Planungsmodulen. Aktuelle End-to-End-Lernverfahren kartieren rohe visuelle Beobachtungen direkt auf Steuersignale oder Trajektorien und versprechen so eine höhere Leistung und Effizienz in Open-World-Szenarien. Die meisten bisherigen End-to-End-Ansätze sind jedoch nach wie vor auf separate Lokalisierungsmodule angewiesen, die für die Zustandsschätzung des eigenen Systems eine genaue extrinsische Sensorkalibrierung voraussetzen, was die Generalisierung über verschiedene Roboterplatformen und Umgebungen hinweg einschränkt. Wir stellen LoGoPlanner vor, ein Lokalisierungsbasiertes, End-to-End-Navigationsframework, das diese Einschränkungen adressiert, indem es: (1) ein Backbone-Modell für langfristige visuelle Geometrie feinjustiert, um Vorhersagen mit absolutem metrischem Maßstab zu fundieren und so eine implizite Zustandsschätzung für eine genaue Lokalisierung bereitzustellen; (2) die Geometrie der Umgebungsszene aus historischen Beobachtungen rekonstruiert, um ein dichtes, feinkörniges Umweltbewusstsein für eine zuverlässige Hindernisvermeidung zu schaffen; und (3) die Policy auf der durch die vorgenannten Hilfsaufgaben gebootstrappten impliziten Geometrie konditioniert, um so die Fehlerfortpflanzung zu reduzieren. Wir evaluieren LoGoPlanner sowohl in Simulationen als auch in realen Umgebungen, wo sein vollständig End-to-End-Design kumulative Fehler reduziert, während metrisch-sensibles Geometriegedächtnis die Planungskonsistenz und Hindernisvermeidung verbessert. Dies führt zu einer Verbesserung von mehr als 27,3 % gegenüber Baseline-Verfahren mit Oracle-Lokalisierung und zu einer starken Generalisierung über verschiedene Roboterplatformen und Umgebungen hinweg. Der Code und die Modelle sind öffentlich auf der https://steinate.github.io/logoplanner.github.io/{Projektseite} verfügbar.
English
Trajectory planning in unstructured environments is a fundamental and challenging capability for mobile robots. Traditional modular pipelines suffer from latency and cascading errors across perception, localization, mapping, and planning modules. Recent end-to-end learning methods map raw visual observations directly to control signals or trajectories, promising greater performance and efficiency in open-world settings. However, most prior end-to-end approaches still rely on separate localization modules that depend on accurate sensor extrinsic calibration for self-state estimation, thereby limiting generalization across embodiments and environments. We introduce LoGoPlanner, a localization-grounded, end-to-end navigation framework that addresses these limitations by: (1) finetuning a long-horizon visual-geometry backbone to ground predictions with absolute metric scale, thereby providing implicit state estimation for accurate localization; (2) reconstructing surrounding scene geometry from historical observations to supply dense, fine-grained environmental awareness for reliable obstacle avoidance; and (3) conditioning the policy on implicit geometry bootstrapped by the aforementioned auxiliary tasks, thereby reducing error propagation.We evaluate LoGoPlanner in both simulation and real-world settings, where its fully end-to-end design reduces cumulative error while metric-aware geometry memory enhances planning consistency and obstacle avoidance, leading to more than a 27.3\% improvement over oracle-localization baselines and strong generalization across embodiments and environments. The code and models have been made publicly available on the https://steinate.github.io/logoplanner.github.io/{project page}.