DreamEditor: Tekstgestuurde 3D-scènebewerking met neurale velden

Samenvatting

Neurale velden hebben indrukwekkende vooruitgang geboekt in viewsynthese en scènereconstructie. Het bewerken van deze neurale velden blijft echter een uitdaging vanwege de impliciete codering van geometrie- en textuurinformatie. In dit artikel stellen we DreamEditor voor, een nieuw framework dat gebruikers in staat stelt gecontroleerde bewerkingen van neurale velden uit te voeren met behulp van tekstprompts. Door scènes voor te stellen als mesh-gebaseerde neurale velden, maakt DreamEditor lokale bewerkingen binnen specifieke regio's mogelijk. DreamEditor maakt gebruik van de tekstencoder van een vooraf getraind tekst-naar-beeld diffusiemodel om automatisch de te bewerken regio's te identificeren op basis van de semantiek van de tekstprompts. Vervolgens optimaliseert DreamEditor de bewerkingsregio en aligneert de geometrie en textuur met de tekstprompts via score-distillatie sampling [29]. Uitgebreide experimenten hebben aangetoond dat DreamEditor neurale velden van real-world scènes nauwkeurig kan bewerken volgens de gegeven tekstprompts, terwijl consistentie in irrelevante gebieden wordt gewaarborgd. DreamEditor genereert zeer realistische texturen en geometrie, wat zowel kwantitatieve als kwalitatieve evaluaties aanzienlijk overtreft ten opzichte van eerdere werken.

English

Neural fields have achieved impressive advancements in view synthesis and scene reconstruction. However, editing these neural fields remains challenging due to the implicit encoding of geometry and texture information. In this paper, we propose DreamEditor, a novel framework that enables users to perform controlled editing of neural fields using text prompts. By representing scenes as mesh-based neural fields, DreamEditor allows localized editing within specific regions. DreamEditor utilizes the text encoder of a pretrained text-to-Image diffusion model to automatically identify the regions to be edited based on the semantics of the text prompts. Subsequently, DreamEditor optimizes the editing region and aligns its geometry and texture with the text prompts through score distillation sampling [29]. Extensive experiments have demonstrated that DreamEditor can accurately edit neural fields of real-world scenes according to the given text prompts while ensuring consistency in irrelevant areas. DreamEditor generates highly realistic textures and geometry, significantly surpassing previous works in both quantitative and qualitative evaluations.

DreamEditor: Tekstgestuurde 3D-scènebewerking met neurale velden

DreamEditor: Text-Driven 3D Scene Editing with Neural Fields

Samenvatting

Support