ChatPaper.aiChatPaper

Modifica Robusta a Livello di Parte con Maschera 3D in 3D Gaussian Splatting mediante Campionamento di Distillazione del Punteggio Regolarizzato

Robust 3D-Masked Part-level Editing in 3D Gaussian Splatting with Regularized Score Distillation Sampling

July 15, 2025
Autori: Hayeon Kim, Ji Ha Jang, Se Young Chun
cs.AI

Abstract

I recenti progressi nelle rappresentazioni neurali 3D e nei modelli di editing a livello di istanza hanno reso possibile la creazione efficiente di contenuti 3D di alta qualità. Tuttavia, ottenere modifiche locali precise in 3D rimane una sfida, specialmente per il Gaussian Splatting, a causa di segmentazioni 2D multi-vista incoerenti delle parti e della natura intrinsecamente ambigua della funzione di perdita Score Distillation Sampling (SDS). Per affrontare queste limitazioni, proponiamo RoMaP, un nuovo framework di editing locale di Gaussian 3D che consente modifiche precise e drastiche a livello di parti. In primo luogo, introduciamo un modulo robusto di generazione di maschere 3D con il nostro 3D-Geometry Aware Label Prediction (3D-GALP), che utilizza coefficienti di armoniche sferiche (SH) per modellare le variazioni delle etichette dipendenti dalla vista e la proprietà delle etichette soft, producendo segmentazioni delle parti accurate e coerenti tra i vari punti di vista. In secondo luogo, proponiamo una funzione di perdita SDS regolarizzata che combina la perdita SDS standard con ulteriori regolarizzatori. In particolare, viene introdotta una perdita L1 di ancoraggio tramite il nostro metodo di editing Scheduled Latent Mixing and Part (SLaMP), che genera immagini 2D modificate di alta qualità e limita le modifiche solo alla regione target preservando la coerenza contestuale. Ulteriori regolarizzatori, come la rimozione del prior gaussiano, migliorano ulteriormente la flessibilità consentendo cambiamenti oltre il contesto esistente, mentre una robusta maschera 3D previene modifiche indesiderate. I risultati sperimentali dimostrano che il nostro RoMaP raggiunge uno stato dell'arte nell'editing locale 3D sia su scene che su oggetti Gaussian ricostruiti e generati, qualitativamente e quantitativamente, rendendo possibile un editing 3D a livello di parti più robusto e flessibile. Il codice è disponibile all'indirizzo https://janeyeon.github.io/romap.
English
Recent advances in 3D neural representations and instance-level editing models have enabled the efficient creation of high-quality 3D content. However, achieving precise local 3D edits remains challenging, especially for Gaussian Splatting, due to inconsistent multi-view 2D part segmentations and inherently ambiguous nature of Score Distillation Sampling (SDS) loss. To address these limitations, we propose RoMaP, a novel local 3D Gaussian editing framework that enables precise and drastic part-level modifications. First, we introduce a robust 3D mask generation module with our 3D-Geometry Aware Label Prediction (3D-GALP), which uses spherical harmonics (SH) coefficients to model view-dependent label variations and soft-label property, yielding accurate and consistent part segmentations across viewpoints. Second, we propose a regularized SDS loss that combines the standard SDS loss with additional regularizers. In particular, an L1 anchor loss is introduced via our Scheduled Latent Mixing and Part (SLaMP) editing method, which generates high-quality part-edited 2D images and confines modifications only to the target region while preserving contextual coherence. Additional regularizers, such as Gaussian prior removal, further improve flexibility by allowing changes beyond the existing context, and robust 3D masking prevents unintended edits. Experimental results demonstrate that our RoMaP achieves state-of-the-art local 3D editing on both reconstructed and generated Gaussian scenes and objects qualitatively and quantitatively, making it possible for more robust and flexible part-level 3D Gaussian editing. Code is available at https://janeyeon.github.io/romap.
PDF371July 22, 2025