ChatPaper.aiChatPaper

Robuuste 3D-gemaskerde deelniveau-bewerking in 3D Gaussian Splatting met Geregulariseerde Score Distillatie Sampling

Robust 3D-Masked Part-level Editing in 3D Gaussian Splatting with Regularized Score Distillation Sampling

July 15, 2025
Auteurs: Hayeon Kim, Ji Ha Jang, Se Young Chun
cs.AI

Samenvatting

Recente vooruitgang in 3D neurale representaties en modellen voor bewerking op instantieniveau hebben de efficiënte creatie van hoogwaardige 3D-inhoud mogelijk gemaakt. Het bereiken van precieze lokale 3D-bewerkingen blijft echter een uitdaging, vooral voor Gaussian Splatting, vanwege inconsistente multi-view 2D-onderdeelsegmentaties en de inherente ambiguïteit van de Score Distillation Sampling (SDS) loss. Om deze beperkingen aan te pakken, stellen we RoMaP voor, een nieuw raamwerk voor lokale 3D Gaussian-bewerkingen dat precieze en drastische wijzigingen op onderdeelniveau mogelijk maakt. Ten eerste introduceren we een robuuste 3D-maskergeneratiemodule met onze 3D-Geometry Aware Label Prediction (3D-GALP), die sferische harmonische (SH) coëfficiënten gebruikt om view-afhankelijke labelvariaties en soft-label eigenschappen te modelleren, wat resulteert in nauwkeurige en consistente onderdeelsegmentaties over verschillende gezichtspunten. Ten tweede stellen we een geregulariseerde SDS loss voor die de standaard SDS loss combineert met aanvullende regularizers. In het bijzonder wordt een L1 anchor loss geïntroduceerd via onze Scheduled Latent Mixing and Part (SLaMP) bewerkingsmethode, die hoogwaardige 2D-afbeeldingen met bewerkte onderdelen genereert en wijzigingen beperkt tot het doelgebied terwijl contextuele samenhang behouden blijft. Aanvullende regularizers, zoals Gaussian prior removal, verbeteren de flexibiliteit verder door wijzigingen mogelijk te maken buiten de bestaande context, en robuuste 3D-masking voorkomt ongewenste bewerkingen. Experimentele resultaten tonen aan dat onze RoMaP state-of-the-art lokale 3D-bewerkingen bereikt op zowel gereconstrueerde als gegenereerde Gaussian-scènes en -objecten, zowel kwalitatief als kwantitatief, wat het mogelijk maakt voor robuustere en flexibelere onderdeelniveau 3D Gaussian-bewerkingen. Code is beschikbaar op https://janeyeon.github.io/romap.
English
Recent advances in 3D neural representations and instance-level editing models have enabled the efficient creation of high-quality 3D content. However, achieving precise local 3D edits remains challenging, especially for Gaussian Splatting, due to inconsistent multi-view 2D part segmentations and inherently ambiguous nature of Score Distillation Sampling (SDS) loss. To address these limitations, we propose RoMaP, a novel local 3D Gaussian editing framework that enables precise and drastic part-level modifications. First, we introduce a robust 3D mask generation module with our 3D-Geometry Aware Label Prediction (3D-GALP), which uses spherical harmonics (SH) coefficients to model view-dependent label variations and soft-label property, yielding accurate and consistent part segmentations across viewpoints. Second, we propose a regularized SDS loss that combines the standard SDS loss with additional regularizers. In particular, an L1 anchor loss is introduced via our Scheduled Latent Mixing and Part (SLaMP) editing method, which generates high-quality part-edited 2D images and confines modifications only to the target region while preserving contextual coherence. Additional regularizers, such as Gaussian prior removal, further improve flexibility by allowing changes beyond the existing context, and robust 3D masking prevents unintended edits. Experimental results demonstrate that our RoMaP achieves state-of-the-art local 3D editing on both reconstructed and generated Gaussian scenes and objects qualitatively and quantitatively, making it possible for more robust and flexible part-level 3D Gaussian editing. Code is available at https://janeyeon.github.io/romap.
PDF371July 22, 2025