ChatPaper.aiChatPaper

SurGe: Geometria de Superfície Aprimorada em Mapas de Pontos

SurGe: Improved Surface Geometry in Point Maps

May 29, 2026
Autores: Karim Knaebel, Gonzalo Martin Garcia, Christian Schmidt, Ilya Fradlin, Lucas Nunes, Daan de Geus, Bastian Leibe
cs.AI

Resumo

Métodos recentes de reconstrução 3D feedforward preveem mapas de pontos e estimam a geometria 3D global de forma notável. No entanto, suas previsões ainda exibem geometria de superfície local imprecisa, que é claramente visível qualitativamente, mas apenas fracamente refletida em métricas comuns. Para tornar esses erros mais explícitos na avaliação, introduzimos uma métrica normal de mapa de pontos que avalia a orientação da superfície local induzida por previsões 3D vizinhas. Para reduzir esses erros, propomos dois componentes complementares: uma perda de correspondência de gradiente de ponto que supervisiona diferenças finitas 3D normalizadas por profundidade, e um Decodificador de Atenção de Vizinhança (NAD) que progressivamente aumenta a resolução das características e usa Atenção de Vizinhança para mistura local de características. Em oito benchmarks de geometria monocular zero-shot, nosso modelo, SurGe, alcança a melhor classificação média para AbsRel global de mapa de pontos e melhora consistentemente as avaliações de mapa de pontos local e normal de mapa de pontos.
English
Recent feedforward 3D reconstruction methods predict point maps and estimate global 3D geometry remarkably well. However, their predictions still exhibit inaccurate local surface geometry, which is clearly visible qualitatively but only weakly reflected in common metrics. To make these errors more explicit in evaluation, we introduce a point map normal metric that evaluates the local surface orientation induced by neighboring 3D predictions. To reduce these errors, we propose two complementary components: a point gradient matching loss that supervises depth-normalized 3D finite differences, and a Neighborhood Attention Decoder (NAD) that progressively upsamples features and uses Neighborhood Attention for local feature mixing. Across eight zero-shot monocular geometry benchmarks, our model, SurGe, achieves the best average rank for global point map AbsRel and consistently improves local point map and point map normal evaluations.