SurGe: 点群マップにおける表面形状の改善
SurGe: Improved Surface Geometry in Point Maps
May 29, 2026
著者: Karim Knaebel, Gonzalo Martin Garcia, Christian Schmidt, Ilya Fradlin, Lucas Nunes, Daan de Geus, Bastian Leibe
cs.AI
要旨
近年のフィードフォワード3D再構成手法は、ポイントマップを予測し、グローバルな3D幾何形状を驚くほど良好に推定する。しかしながら、それらの予測は依然として不正確な局所表面幾何形状を示しており、これは質的には明らかに観察できるものの、一般的な評価指標には弱くしか反映されない。これらの誤差を評価においてより明確にするため、我々は近傍の3D予測から誘導される局所表面の方向を評価するポイントマップ法線指標を導入する。これらの誤差を低減するため、我々は2つの相補的な構成要素を提案する: 深度正規化された3D有限差分を教師するポイント勾配マッチング損失、および特徴量を段階的にアップサンプリングし、局所特徴量混合に近傍注意(Neighborhood Attention)を用いる近傍注意デコーダ(NAD)である。8つのゼロショット単眼幾何形状ベンチマークにおいて、我々のモデルSurGeは、グローバルポイントマップのAbsRelで最良の平均順位を達成し、局所ポイントマップおよびポイントマップ法線評価を一貫して改善する。
English
Recent feedforward 3D reconstruction methods predict point maps and estimate global 3D geometry remarkably well. However, their predictions still exhibit inaccurate local surface geometry, which is clearly visible qualitatively but only weakly reflected in common metrics. To make these errors more explicit in evaluation, we introduce a point map normal metric that evaluates the local surface orientation induced by neighboring 3D predictions. To reduce these errors, we propose two complementary components: a point gradient matching loss that supervises depth-normalized 3D finite differences, and a Neighborhood Attention Decoder (NAD) that progressively upsamples features and uses Neighborhood Attention for local feature mixing. Across eight zero-shot monocular geometry benchmarks, our model, SurGe, achieves the best average rank for global point map AbsRel and consistently improves local point map and point map normal evaluations.