ChatPaper.aiChatPaper

Segment Any 3Dガウシアン

Segment Any 3D Gaussians

December 1, 2023
著者: Jiazhong Cen, Jiemin Fang, Chen Yang, Lingxi Xie, Xiaopeng Zhang, Wei Shen, Qi Tian
cs.AI

要旨

放射場におけるインタラクティブな3Dセグメンテーションは、3Dシーンの理解と操作における重要性から、非常に魅力的なタスクです。しかし、既存の手法は、細粒度かつ多粒度のセグメンテーションを実現するか、あるいは大幅な計算オーバーヘッドに対処するかのいずれかに課題を抱えており、リアルタイムでのインタラクションを妨げています。本論文では、Segment Any 3D GAussians(SAGA)を紹介します。これは、2Dセグメンテーションの基盤モデルと、放射場の最近のブレークスルーである3D Gaussian Splatting(3DGS)をシームレスに統合した新しい3Dインタラクティブセグメンテーション手法です。SAGAは、セグメンテーション基盤モデルによって生成された多粒度の2Dセグメンテーション結果を、設計されたコントラスティブトレーニングを通じて3Dガウシアンポイント特徴に効率的に埋め込みます。既存のベンチマークでの評価により、SAGAが最先端の手法と競争力のある性能を発揮できることが示されています。さらに、SAGAは多粒度のセグメンテーションを実現し、ポイント、スクリブル、2Dマスクなど様々なプロンプトに対応します。特に、SAGAはミリ秒単位で3Dセグメンテーションを完了し、以前のSOTAと比較して約1000倍の高速化を達成しています。プロジェクトページはhttps://jumpat.github.io/SAGAにあります。
English
Interactive 3D segmentation in radiance fields is an appealing task since its importance in 3D scene understanding and manipulation. However, existing methods face challenges in either achieving fine-grained, multi-granularity segmentation or contending with substantial computational overhead, inhibiting real-time interaction. In this paper, we introduce Segment Any 3D GAussians (SAGA), a novel 3D interactive segmentation approach that seamlessly blends a 2D segmentation foundation model with 3D Gaussian Splatting (3DGS), a recent breakthrough of radiance fields. SAGA efficiently embeds multi-granularity 2D segmentation results generated by the segmentation foundation model into 3D Gaussian point features through well-designed contrastive training. Evaluation on existing benchmarks demonstrates that SAGA can achieve competitive performance with state-of-the-art methods. Moreover, SAGA achieves multi-granularity segmentation and accommodates various prompts, including points, scribbles, and 2D masks. Notably, SAGA can finish the 3D segmentation within milliseconds, achieving nearly 1000x acceleration compared to previous SOTA. The project page is at https://jumpat.github.io/SAGA.
PDF111December 15, 2024