ChatPaper.aiChatPaper

Splatting 3D Gaussiano Livre de COLMAP

COLMAP-Free 3D Gaussian Splatting

December 12, 2023
Autores: Yang Fu, Sifei Liu, Amey Kulkarni, Jan Kautz, Alexei A. Efros, Xiaolong Wang
cs.AI

Resumo

Embora a renderização neural tenha levado a avanços impressionantes na reconstrução de cenas e na síntese de novas perspectivas, ela depende fortemente de poses de câmera pré-calculadas com precisão. Para relaxar essa restrição, diversos esforços foram feitos para treinar Campos de Radiação Neural (NeRFs) sem poses de câmera pré-processadas. No entanto, as representações implícitas dos NeRFs apresentam desafios adicionais para otimizar simultaneamente a estrutura 3D e as poses da câmera. Por outro lado, o recentemente proposto 3D Gaussian Splatting oferece novas oportunidades, dada sua representação explícita de nuvem de pontos. Este artigo aproveita tanto a representação geométrica explícita quanto a continuidade do fluxo de vídeo de entrada para realizar a síntese de novas perspectivas sem qualquer pré-processamento de SfM. Processamos os quadros de entrada de maneira sequencial e expandimos progressivamente o conjunto de Gaussianas 3D, tomando um quadro de entrada por vez, sem a necessidade de pré-calcular as poses da câmera. Nosso método melhora significativamente em relação às abordagens anteriores na síntese de perspectivas e na estimativa de poses da câmera sob grandes mudanças de movimento. Nossa página do projeto está disponível em https://oasisyang.github.io/colmap-free-3dgs.
English
While neural rendering has led to impressive advances in scene reconstruction and novel view synthesis, it relies heavily on accurately pre-computed camera poses. To relax this constraint, multiple efforts have been made to train Neural Radiance Fields (NeRFs) without pre-processed camera poses. However, the implicit representations of NeRFs provide extra challenges to optimize the 3D structure and camera poses at the same time. On the other hand, the recently proposed 3D Gaussian Splatting provides new opportunities given its explicit point cloud representations. This paper leverages both the explicit geometric representation and the continuity of the input video stream to perform novel view synthesis without any SfM preprocessing. We process the input frames in a sequential manner and progressively grow the 3D Gaussians set by taking one input frame at a time, without the need to pre-compute the camera poses. Our method significantly improves over previous approaches in view synthesis and camera pose estimation under large motion changes. Our project page is https://oasisyang.github.io/colmap-free-3dgs
PDF150December 15, 2024