ChatPaper.aiChatPaper

Edição Gaussiana 3D com uma Única Imagem

3D Gaussian Editing with A Single Image

August 14, 2024
Autores: Guan Luo, Tian-Xing Xu, Ying-Tian Liu, Xiao-Xiong Fan, Fang-Lue Zhang, Song-Hai Zhang
cs.AI

Resumo

A modelagem e manipulação de cenas 3D capturadas do mundo real são fundamentais em várias aplicações, atraindo crescente interesse de pesquisa. Enquanto trabalhos anteriores em edição alcançaram resultados interessantes por meio da manipulação de malhas 3D, frequentemente exigem malhas reconstruídas com precisão para realizar a edição, o que limita sua aplicação na geração de conteúdo 3D. Para abordar essa lacuna, introduzimos uma nova abordagem de edição de cenas 3D impulsionada por uma única imagem, baseada em Espalhamento Gaussiano 3D, permitindo manipulação intuitiva por meio da edição direta do conteúdo em um plano de imagem 2D. Nosso método aprende a otimizar os Gaussianos 3D para se alinharem com uma versão editada da imagem renderizada a partir de um ponto de vista especificado pelo usuário da cena original. Para capturar deformações de objetos em longas distâncias, introduzimos perda posicional no processo de otimização do Espalhamento Gaussiano 3D e possibilitamos a propagação de gradientes por meio de reparametrização. Para lidar com Gaussianos 3D ocultos ao renderizar a partir do ponto de vista especificado, construímos uma estrutura baseada em âncoras e empregamos uma estratégia de otimização de baixa para alta resolução capaz de lidar com deformações em longas distâncias mantendo a estabilidade estrutural. Além disso, projetamos uma nova estratégia de máscara para identificar adaptativamente regiões de deformação não rígida para modelagem em pequena escala. Experimentos extensivos mostram a eficácia de nosso método no tratamento de detalhes geométricos, deformações em longas distâncias e não rígidas, demonstrando flexibilidade e qualidade de edição superiores em comparação com abordagens anteriores.
English
The modeling and manipulation of 3D scenes captured from the real world are pivotal in various applications, attracting growing research interest. While previous works on editing have achieved interesting results through manipulating 3D meshes, they often require accurately reconstructed meshes to perform editing, which limits their application in 3D content generation. To address this gap, we introduce a novel single-image-driven 3D scene editing approach based on 3D Gaussian Splatting, enabling intuitive manipulation via directly editing the content on a 2D image plane. Our method learns to optimize the 3D Gaussians to align with an edited version of the image rendered from a user-specified viewpoint of the original scene. To capture long-range object deformation, we introduce positional loss into the optimization process of 3D Gaussian Splatting and enable gradient propagation through reparameterization. To handle occluded 3D Gaussians when rendering from the specified viewpoint, we build an anchor-based structure and employ a coarse-to-fine optimization strategy capable of handling long-range deformation while maintaining structural stability. Furthermore, we design a novel masking strategy to adaptively identify non-rigid deformation regions for fine-scale modeling. Extensive experiments show the effectiveness of our method in handling geometric details, long-range, and non-rigid deformation, demonstrating superior editing flexibility and quality compared to previous approaches.

Summary

AI-Generated Summary

PDF113November 28, 2024