ChatPaper.aiChatPaper

FlashSplat: Segmentación Óptima de Splatting Gaussiano de 2D a 3D

FlashSplat: 2D to 3D Gaussian Splatting Segmentation Solved Optimally

September 12, 2024
Autores: Qiuhong Shen, Xingyi Yang, Xinchao Wang
cs.AI

Resumen

Este estudio aborda el desafío de segmentar con precisión la dispersión gaussiana 3D a partir de máscaras 2D. Los métodos convencionales suelen depender de un descenso de gradiente iterativo para asignar a cada gaussiana una etiqueta única, lo que conlleva una optimización prolongada y soluciones subóptimas. En cambio, proponemos un solucionador directo pero globalmente óptimo para la segmentación de GS 3D. La idea central de nuestro método es que, con una escena 3D-GS reconstruida, la renderización de las máscaras 2D es esencialmente una función lineal con respecto a las etiquetas de cada gaussiana. Por lo tanto, la asignación óptima de etiquetas se puede resolver a través de programación lineal en forma cerrada. Esta solución aprovecha la característica de mezcla alfa del proceso de dispersión para la optimización en un solo paso. Al incorporar el sesgo de fondo en nuestra función objetivo, nuestro método muestra una robustez superior en la segmentación 3D contra ruidos. Notablemente, nuestra optimización se completa en 30 segundos, aproximadamente 50 veces más rápido que los mejores métodos existentes. Experimentos extensos demuestran la eficiencia y robustez de nuestro método en la segmentación de diversas escenas, y su rendimiento superior en tareas posteriores como la eliminación de objetos y el rellenado. Las demostraciones y el código estarán disponibles en https://github.com/florinshen/FlashSplat.
English
This study addresses the challenge of accurately segmenting 3D Gaussian Splatting from 2D masks. Conventional methods often rely on iterative gradient descent to assign each Gaussian a unique label, leading to lengthy optimization and sub-optimal solutions. Instead, we propose a straightforward yet globally optimal solver for 3D-GS segmentation. The core insight of our method is that, with a reconstructed 3D-GS scene, the rendering of the 2D masks is essentially a linear function with respect to the labels of each Gaussian. As such, the optimal label assignment can be solved via linear programming in closed form. This solution capitalizes on the alpha blending characteristic of the splatting process for single step optimization. By incorporating the background bias in our objective function, our method shows superior robustness in 3D segmentation against noises. Remarkably, our optimization completes within 30 seconds, about 50times faster than the best existing methods. Extensive experiments demonstrate the efficiency and robustness of our method in segmenting various scenes, and its superior performance in downstream tasks such as object removal and inpainting. Demos and code will be available at https://github.com/florinshen/FlashSplat.

Summary

AI-Generated Summary

PDF122November 16, 2024