ChatPaper.aiChatPaper

ResFields: 시공간 신호를 위한 잔차 신경 필드

ResFields: Residual Neural Fields for Spatiotemporal Signals

September 6, 2023
저자: Marko Mihajlovic, Sergey Prokudin, Marc Pollefeys, Siyu Tang
cs.AI

초록

고주파 신호를 표현하도록 훈련된 신경망의 한 범주인 뉴럴 필드(Neural Fields)는 최근 복잡한 3D 데이터, 특히 단일 다층 퍼셉트론(MLP)을 통해 대규모 신경 부호 거리(SDF) 또는 방사 필드(NeRF)를 모델링하는 데 있어 인상적인 성능을 보이며 상당한 주목을 받고 있습니다. 그러나 MLP를 사용하여 신호를 표현하는 방법이 강력하고 간단함에도 불구하고, MLP의 제한된 용량으로 인해 크고 복잡한 시간적 신호를 모델링할 때 여전히 어려움에 직면합니다. 본 논문에서는 이러한 한계를 해결하기 위해 시간적 잔차 레이어를 뉴럴 필드에 통합하는 효과적인 접근 방식을 제안하며, 이를 ResFields라고 명명합니다. ResFields는 복잡한 시간적 신호를 효과적으로 표현하도록 특별히 설계된 새로운 클래스의 네트워크입니다. 우리는 ResFields의 특성을 포괄적으로 분석하고, 학습 가능한 매개변수의 수를 줄이고 일반화 능력을 향상시키기 위한 행렬 분해 기법을 제안합니다. 특히, 우리의 공식화는 기존 기술과 원활하게 통합되며, 2D 비디오 근사, 시간적 SDF를 통한 동적 형태 모델링, 동적 NeRF 재구성과 같은 다양한 도전적인 작업에서 일관되게 결과를 개선합니다. 마지막으로, 경량 캡처 시스템의 희소한 센서 입력으로부터 동적 3D 장면을 포착하는 데 ResFields의 실용적인 유용성을 입증합니다.
English
Neural fields, a category of neural networks trained to represent high-frequency signals, have gained significant attention in recent years due to their impressive performance in modeling complex 3D data, especially large neural signed distance (SDFs) or radiance fields (NeRFs) via a single multi-layer perceptron (MLP). However, despite the power and simplicity of representing signals with an MLP, these methods still face challenges when modeling large and complex temporal signals due to the limited capacity of MLPs. In this paper, we propose an effective approach to address this limitation by incorporating temporal residual layers into neural fields, dubbed ResFields, a novel class of networks specifically designed to effectively represent complex temporal signals. We conduct a comprehensive analysis of the properties of ResFields and propose a matrix factorization technique to reduce the number of trainable parameters and enhance generalization capabilities. Importantly, our formulation seamlessly integrates with existing techniques and consistently improves results across various challenging tasks: 2D video approximation, dynamic shape modeling via temporal SDFs, and dynamic NeRF reconstruction. Lastly, we demonstrate the practical utility of ResFields by showcasing its effectiveness in capturing dynamic 3D scenes from sparse sensory inputs of a lightweight capture system.
PDF80December 15, 2024