ChatPaper.aiChatPaper

ResFields: Residuele Neurale Velden voor Spatiotemporele Signalen

ResFields: Residual Neural Fields for Spatiotemporal Signals

September 6, 2023
Auteurs: Marko Mihajlovic, Sergey Prokudin, Marc Pollefeys, Siyu Tang
cs.AI

Samenvatting

Neurale velden, een categorie van neurale netwerken die zijn getraind om hoogfrequente signalen weer te geven, hebben de afgelopen jaren aanzienlijke aandacht gekregen vanwege hun indrukwekkende prestaties bij het modelleren van complexe 3D-data, met name grote neurale signed distance fields (SDFs) of radiance fields (NeRFs) via een enkel multi-layer perceptron (MLP). Ondanks de kracht en eenvoud van het weergeven van signalen met een MLP, kampen deze methoden nog steeds met uitdagingen bij het modelleren van grote en complexe temporele signalen vanwege de beperkte capaciteit van MLPs. In dit artikel stellen we een effectieve aanpak voor om deze beperking aan te pakken door temporele residulagen te integreren in neurale velden, genaamd ResFields, een nieuwe klasse van netwerken die specifiek zijn ontworpen om complexe temporele signalen effectief weer te geven. We voeren een uitgebreide analyse uit van de eigenschappen van ResFields en stellen een matrixfactorisatietechniek voor om het aantal trainbare parameters te verminderen en de generalisatiecapaciteiten te verbeteren. Belangrijk is dat onze formulering naadloos integreert met bestaande technieken en consistent betere resultaten oplevert bij verschillende uitdagende taken: 2D-video-approximatie, dynamische vormmodellering via temporele SDFs, en dynamische NeRF-reconstructie. Tot slot demonstreren we de praktische bruikbaarheid van ResFields door de effectiviteit ervan te tonen bij het vastleggen van dynamische 3D-scènes vanuit schaarse sensorische inputs van een lichtgewicht capturesysteem.
English
Neural fields, a category of neural networks trained to represent high-frequency signals, have gained significant attention in recent years due to their impressive performance in modeling complex 3D data, especially large neural signed distance (SDFs) or radiance fields (NeRFs) via a single multi-layer perceptron (MLP). However, despite the power and simplicity of representing signals with an MLP, these methods still face challenges when modeling large and complex temporal signals due to the limited capacity of MLPs. In this paper, we propose an effective approach to address this limitation by incorporating temporal residual layers into neural fields, dubbed ResFields, a novel class of networks specifically designed to effectively represent complex temporal signals. We conduct a comprehensive analysis of the properties of ResFields and propose a matrix factorization technique to reduce the number of trainable parameters and enhance generalization capabilities. Importantly, our formulation seamlessly integrates with existing techniques and consistently improves results across various challenging tasks: 2D video approximation, dynamic shape modeling via temporal SDFs, and dynamic NeRF reconstruction. Lastly, we demonstrate the practical utility of ResFields by showcasing its effectiveness in capturing dynamic 3D scenes from sparse sensory inputs of a lightweight capture system.
PDF80December 15, 2024