ChatPaper.aiChatPaper

ResFields: Campos Neurais Residuais para Sinais Espaço-Temporais

ResFields: Residual Neural Fields for Spatiotemporal Signals

September 6, 2023
Autores: Marko Mihajlovic, Sergey Prokudin, Marc Pollefeys, Siyu Tang
cs.AI

Resumo

Campos neurais, uma categoria de redes neurais treinadas para representar sinais de alta frequência, têm ganhado atenção significativa nos últimos anos devido ao seu desempenho impressionante na modelagem de dados 3D complexos, especialmente grandes campos de distância assinada neural (SDFs) ou campos de radiação (NeRFs) por meio de um único perceptron multicamadas (MLP). No entanto, apesar do poder e da simplicidade de representar sinais com um MLP, esses métodos ainda enfrentam desafios ao modelar sinais temporais grandes e complexos devido à capacidade limitada dos MLPs. Neste artigo, propomos uma abordagem eficaz para superar essa limitação ao incorporar camadas residuais temporais em campos neurais, denominadas ResFields, uma nova classe de redes projetadas especificamente para representar eficazmente sinais temporais complexos. Realizamos uma análise abrangente das propriedades dos ResFields e propomos uma técnica de fatoração de matrizes para reduzir o número de parâmetros treináveis e aprimorar as capacidades de generalização. Importante destacar que nossa formulação se integra perfeitamente com técnicas existentes e melhora consistentemente os resultados em várias tarefas desafiadoras: aproximação de vídeos 2D, modelagem de formas dinâmicas via SDFs temporais e reconstrução dinâmica de NeRFs. Por fim, demonstramos a utilidade prática dos ResFields ao mostrar sua eficácia na captura de cenas 3D dinâmicas a partir de entradas sensoriais esparsas de um sistema de captura leve.
English
Neural fields, a category of neural networks trained to represent high-frequency signals, have gained significant attention in recent years due to their impressive performance in modeling complex 3D data, especially large neural signed distance (SDFs) or radiance fields (NeRFs) via a single multi-layer perceptron (MLP). However, despite the power and simplicity of representing signals with an MLP, these methods still face challenges when modeling large and complex temporal signals due to the limited capacity of MLPs. In this paper, we propose an effective approach to address this limitation by incorporating temporal residual layers into neural fields, dubbed ResFields, a novel class of networks specifically designed to effectively represent complex temporal signals. We conduct a comprehensive analysis of the properties of ResFields and propose a matrix factorization technique to reduce the number of trainable parameters and enhance generalization capabilities. Importantly, our formulation seamlessly integrates with existing techniques and consistently improves results across various challenging tasks: 2D video approximation, dynamic shape modeling via temporal SDFs, and dynamic NeRF reconstruction. Lastly, we demonstrate the practical utility of ResFields by showcasing its effectiveness in capturing dynamic 3D scenes from sparse sensory inputs of a lightweight capture system.
PDF80December 15, 2024