ChatPaper.aiChatPaper

FlashSplat: Оптимальное решение задачи сегментации методом Гауссовского сплетинга 2D в 3D

FlashSplat: 2D to 3D Gaussian Splatting Segmentation Solved Optimally

September 12, 2024
Авторы: Qiuhong Shen, Xingyi Yang, Xinchao Wang
cs.AI

Аннотация

Данное исследование рассматривает проблему точного сегментирования трехмерного гауссовского сплэтинга из двумерных масок. Традиционные методы часто полагаются на итеративный градиентный спуск для присвоения каждому гауссиану уникальной метки, что приводит к длительной оптимизации и субоптимальным решениям. Вместо этого мы предлагаем простой, но глобально оптимальный солвер для сегментации трехмерного гауссовского сплэтинга. Основная идея нашего метода заключается в том, что с восстановленной трехмерной сценой гауссовского сплэтинга рендеринг двумерных масок в основном является линейной функцией относительно меток каждого гауссиана. Таким образом, оптимальное присвоение меток может быть решено с помощью линейного программирования в замкнутой форме. Это решение использует характеристику альфа-смешивания процесса сплэтинга для оптимизации за один шаг. Включив фоновое смещение в нашу целевую функцию, наш метод проявляет превосходную устойчивость в трехмерной сегментации против шумов. Замечательно, что наша оптимизация завершается менее чем за 30 секунд, примерно в 50 раз быстрее, чем лучшие существующие методы. Обширные эксперименты демонстрируют эффективность и устойчивость нашего метода при сегментации различных сцен, а также его превосходную производительность в последующих задачах, таких как удаление объектов и заполнение пробелов. Демонстрации и код будут доступны на https://github.com/florinshen/FlashSplat.
English
This study addresses the challenge of accurately segmenting 3D Gaussian Splatting from 2D masks. Conventional methods often rely on iterative gradient descent to assign each Gaussian a unique label, leading to lengthy optimization and sub-optimal solutions. Instead, we propose a straightforward yet globally optimal solver for 3D-GS segmentation. The core insight of our method is that, with a reconstructed 3D-GS scene, the rendering of the 2D masks is essentially a linear function with respect to the labels of each Gaussian. As such, the optimal label assignment can be solved via linear programming in closed form. This solution capitalizes on the alpha blending characteristic of the splatting process for single step optimization. By incorporating the background bias in our objective function, our method shows superior robustness in 3D segmentation against noises. Remarkably, our optimization completes within 30 seconds, about 50times faster than the best existing methods. Extensive experiments demonstrate the efficiency and robustness of our method in segmenting various scenes, and its superior performance in downstream tasks such as object removal and inpainting. Demos and code will be available at https://github.com/florinshen/FlashSplat.

Summary

AI-Generated Summary

PDF122November 16, 2024