ChatPaper.aiChatPaper

GENIE: Gaußsche Kodierung für interaktive Bearbeitung von Neural Radiance Fields

GENIE: Gaussian Encoding for Neural Radiance Fields Interactive Editing

August 4, 2025
papers.authors: Mikołaj Zieliński, Krzysztof Byrski, Tomasz Szczepanik, Przemysław Spurek
cs.AI

papers.abstract

Neural Radiance Fields (NeRF) und Gaussian Splatting (GS) haben kürzlich die 3D-Szenendarstellung und -Rendering revolutioniert. NeRF erreicht eine hochauflösende Synthese neuer Ansichten durch das Erlernen volumetrischer Darstellungen mittels neuronaler Netzwerke, doch seine implizite Kodierung erschwert die Bearbeitung und physikalische Interaktion. Im Gegensatz dazu repräsentiert GS Szenen als explizite Sammlungen von Gaußschen Primitiven, was Echtzeit-Rendering, schnellere Trainingszeiten und intuitivere Manipulation ermöglicht. Diese explizite Struktur macht GS besonders geeignet für interaktive Bearbeitung und Integration mit physikbasierter Simulation. In diesem Artikel stellen wir GENIE (Gaussian Encoding for Neural Radiance Fields Interactive Editing) vor, ein hybrides Modell, das die fotorealistische Rendering-Qualität von NeRF mit der bearbeitbaren und strukturierten Darstellung von GS kombiniert. Anstelle von sphärischen Harmoniken zur Erscheinungsmodellierung weisen wir jedem Gaußschen Primitiv ein trainierbares Feature-Embedding zu. Diese Embeddings werden verwendet, um ein NeRF-Netzwerk basierend auf den k nächsten Gaußschen zu jedem Abfragepunkt zu konditionieren. Um diese Konditionierung effizient zu gestalten, führen wir Ray-Traced Gaussian Proximity Search (RT-GPS) ein, eine schnelle Suche nach den nächsten Gaußschen basierend auf einer modifizierten Ray-Tracing-Pipeline. Zudem integrieren wir ein Multi-Resolution-Hash-Grid, um Gaußsche Features zu initialisieren und zu aktualisieren. Zusammen ermöglichen diese Komponenten eine Echtzeit-Bearbeitung mit Lokalitätsbewusstsein: Wenn Gaußsche Primitiven neu positioniert oder modifiziert werden, spiegelt sich ihr interpoliertes Einflussgebiet unmittelbar im gerenderten Ergebnis wider. Durch die Kombination der Stärken impliziter und expliziter Darstellungen unterstützt GENIE intuitive Szenenmanipulation, dynamische Interaktion und Kompatibilität mit physikalischer Simulation und schließt so die Lücke zwischen geometriebasierter Bearbeitung und neuronalem Rendering. Der Code ist unter (https://github.com/MikolajZielinski/genie) verfügbar.
English
Neural Radiance Fields (NeRF) and Gaussian Splatting (GS) have recently transformed 3D scene representation and rendering. NeRF achieves high-fidelity novel view synthesis by learning volumetric representations through neural networks, but its implicit encoding makes editing and physical interaction challenging. In contrast, GS represents scenes as explicit collections of Gaussian primitives, enabling real-time rendering, faster training, and more intuitive manipulation. This explicit structure has made GS particularly well-suited for interactive editing and integration with physics-based simulation. In this paper, we introduce GENIE (Gaussian Encoding for Neural Radiance Fields Interactive Editing), a hybrid model that combines the photorealistic rendering quality of NeRF with the editable and structured representation of GS. Instead of using spherical harmonics for appearance modeling, we assign each Gaussian a trainable feature embedding. These embeddings are used to condition a NeRF network based on the k nearest Gaussians to each query point. To make this conditioning efficient, we introduce Ray-Traced Gaussian Proximity Search (RT-GPS), a fast nearest Gaussian search based on a modified ray-tracing pipeline. We also integrate a multi-resolution hash grid to initialize and update Gaussian features. Together, these components enable real-time, locality-aware editing: as Gaussian primitives are repositioned or modified, their interpolated influence is immediately reflected in the rendered output. By combining the strengths of implicit and explicit representations, GENIE supports intuitive scene manipulation, dynamic interaction, and compatibility with physical simulation, bridging the gap between geometry-based editing and neural rendering. The code can be found under (https://github.com/MikolajZielinski/genie)
PDF112August 11, 2025