ChatPaper.aiChatPaper

FlashSplat: 2D zu 3D Gauss'sches Splatting Segmentierung optimal gelöst

FlashSplat: 2D to 3D Gaussian Splatting Segmentation Solved Optimally

September 12, 2024
Autoren: Qiuhong Shen, Xingyi Yang, Xinchao Wang
cs.AI

Zusammenfassung

Diese Studie befasst sich mit der Herausforderung, 3D-Gauß-Splatting genau aus 2D-Masken zu segmentieren. Herkömmliche Methoden verlassen sich oft auf iterative Gradientenabstiegsverfahren, um jedem Gauß eine eindeutige Kennzeichnung zuzuweisen, was zu langwierigen Optimierungen und suboptimalen Lösungen führt. Stattdessen schlagen wir einen einfachen, aber global optimalen Solver für die 3D-GS-Segmentierung vor. Der Kerngedanke unserer Methode ist, dass bei einer rekonstruierten 3D-GS-Szene die Darstellung der 2D-Masken im Wesentlichen eine lineare Funktion in Bezug auf die Kennzeichnungen jedes Gaußschen ist. Als solches kann die optimale Kennzeichnung durch lineare Programmierung in geschlossener Form gelöst werden. Diese Lösung nutzt die Alpha-Blending-Eigenschaft des Splatting-Prozesses für die Optimierung in einem Schritt aus. Durch die Einbeziehung des Hintergrundbias in unsere Ziel-Funktion zeigt unsere Methode eine überlegene Robustheit bei der 3D-Segmentierung gegenüber Störungen. Bemerkenswerterweise ist unsere Optimierung innerhalb von 30 Sekunden abgeschlossen, etwa 50-mal schneller als die besten vorhandenen Methoden. Umfangreiche Experimente zeigen die Effizienz und Robustheit unserer Methode bei der Segmentierung verschiedener Szenen sowie ihre überlegene Leistung bei nachgelagerten Aufgaben wie Objektentfernung und Inpainting. Demos und Code sind verfügbar unter https://github.com/florinshen/FlashSplat.
English
This study addresses the challenge of accurately segmenting 3D Gaussian Splatting from 2D masks. Conventional methods often rely on iterative gradient descent to assign each Gaussian a unique label, leading to lengthy optimization and sub-optimal solutions. Instead, we propose a straightforward yet globally optimal solver for 3D-GS segmentation. The core insight of our method is that, with a reconstructed 3D-GS scene, the rendering of the 2D masks is essentially a linear function with respect to the labels of each Gaussian. As such, the optimal label assignment can be solved via linear programming in closed form. This solution capitalizes on the alpha blending characteristic of the splatting process for single step optimization. By incorporating the background bias in our objective function, our method shows superior robustness in 3D segmentation against noises. Remarkably, our optimization completes within 30 seconds, about 50times faster than the best existing methods. Extensive experiments demonstrate the efficiency and robustness of our method in segmenting various scenes, and its superior performance in downstream tasks such as object removal and inpainting. Demos and code will be available at https://github.com/florinshen/FlashSplat.

Summary

AI-Generated Summary

PDF122November 16, 2024