ChatPaper.aiChatPaper

SurGe: Geometría de superficie mejorada en mapas de puntos

SurGe: Improved Surface Geometry in Point Maps

May 29, 2026
Autores: Karim Knaebel, Gonzalo Martin Garcia, Christian Schmidt, Ilya Fradlin, Lucas Nunes, Daan de Geus, Bastian Leibe
cs.AI

Resumen

Los métodos recientes de reconstrucción 3D con alimentación directa predicen mapas de puntos y estiman la geometría 3D global de manera notable. Sin embargo, sus predicciones aún presentan una geometría de superficie local inexacta, que es claramente visible cualitativamente pero solo se refleja débilmente en las métricas comunes. Para hacer estos errores más explícitos en la evaluación, introducimos una métrica normal de mapa de puntos que evalúa la orientación de la superficie local inducida por las predicciones 3D vecinas. Para reducir estos errores, proponemos dos componentes complementarios: una función de pérdida de coincidencia de gradientes de puntos que supervisa las diferencias finitas 3D normalizadas por profundidad, y un Decodificador de Atención de Vecindario (NAD) que aumenta progresivamente la resolución de las características y utiliza Atención de Vecindario para la mezcla local de características. En ocho puntos de referencia monocular de geometría de cero disparos, nuestro modelo, SurGe, logra el mejor rango promedio en AbsRel de mapas de puntos globales y mejora de manera consistente las evaluaciones de mapas de puntos locales y normales de mapas de puntos.
English
Recent feedforward 3D reconstruction methods predict point maps and estimate global 3D geometry remarkably well. However, their predictions still exhibit inaccurate local surface geometry, which is clearly visible qualitatively but only weakly reflected in common metrics. To make these errors more explicit in evaluation, we introduce a point map normal metric that evaluates the local surface orientation induced by neighboring 3D predictions. To reduce these errors, we propose two complementary components: a point gradient matching loss that supervises depth-normalized 3D finite differences, and a Neighborhood Attention Decoder (NAD) that progressively upsamples features and uses Neighborhood Attention for local feature mixing. Across eight zero-shot monocular geometry benchmarks, our model, SurGe, achieves the best average rank for global point map AbsRel and consistently improves local point map and point map normal evaluations.