Segment Any 3Dガウシアン
Segment Any 3D Gaussians
December 1, 2023
著者: Jiazhong Cen, Jiemin Fang, Chen Yang, Lingxi Xie, Xiaopeng Zhang, Wei Shen, Qi Tian
cs.AI
要旨
放射場におけるインタラクティブな3Dセグメンテーションは、3Dシーンの理解と操作における重要性から、非常に魅力的なタスクです。しかし、既存の手法は、細粒度かつ多粒度のセグメンテーションを実現するか、あるいは大幅な計算オーバーヘッドに対処するかのいずれかに課題を抱えており、リアルタイムでのインタラクションを妨げています。本論文では、Segment Any 3D GAussians(SAGA)を紹介します。これは、2Dセグメンテーションの基盤モデルと、放射場の最近のブレークスルーである3D Gaussian Splatting(3DGS)をシームレスに統合した新しい3Dインタラクティブセグメンテーション手法です。SAGAは、セグメンテーション基盤モデルによって生成された多粒度の2Dセグメンテーション結果を、設計されたコントラスティブトレーニングを通じて3Dガウシアンポイント特徴に効率的に埋め込みます。既存のベンチマークでの評価により、SAGAが最先端の手法と競争力のある性能を発揮できることが示されています。さらに、SAGAは多粒度のセグメンテーションを実現し、ポイント、スクリブル、2Dマスクなど様々なプロンプトに対応します。特に、SAGAはミリ秒単位で3Dセグメンテーションを完了し、以前のSOTAと比較して約1000倍の高速化を達成しています。プロジェクトページはhttps://jumpat.github.io/SAGAにあります。
English
Interactive 3D segmentation in radiance fields is an appealing task since its
importance in 3D scene understanding and manipulation. However, existing
methods face challenges in either achieving fine-grained, multi-granularity
segmentation or contending with substantial computational overhead, inhibiting
real-time interaction. In this paper, we introduce Segment Any 3D GAussians
(SAGA), a novel 3D interactive segmentation approach that seamlessly blends a
2D segmentation foundation model with 3D Gaussian Splatting (3DGS), a recent
breakthrough of radiance fields. SAGA efficiently embeds multi-granularity 2D
segmentation results generated by the segmentation foundation model into 3D
Gaussian point features through well-designed contrastive training. Evaluation
on existing benchmarks demonstrates that SAGA can achieve competitive
performance with state-of-the-art methods. Moreover, SAGA achieves
multi-granularity segmentation and accommodates various prompts, including
points, scribbles, and 2D masks. Notably, SAGA can finish the 3D segmentation
within milliseconds, achieving nearly 1000x acceleration compared to previous
SOTA. The project page is at https://jumpat.github.io/SAGA.