SCas4D: Otimização Estrutural em Cascata para Aprimorar a Síntese Persistente de Novas Visões 4D
SCas4D: Structural Cascaded Optimization for Boosting Persistent 4D Novel View Synthesis
October 8, 2025
Autores: Jipeng Lyu, Jiahua Dong, Yu-Xiong Wang
cs.AI
Resumo
A modelagem persistente de cenas dinâmicas para rastreamento e síntese de novas visões continua desafiadora devido à dificuldade de capturar deformações precisas enquanto se mantém a eficiência computacional. Propomos o SCas4D, uma estrutura de otimização em cascata que aproveita padrões estruturais no Splatting Gaussiano 3D para cenas dinâmicas. A ideia central é que as deformações do mundo real frequentemente exibem padrões hierárquicos, onde grupos de Gaussianas compartilham transformações semelhantes. Ao refinar progressivamente as deformações de um nível grosso de partes para um nível fino de pontos, o SCas4D alcança convergência em até 100 iterações por quadro de tempo e produz resultados comparáveis aos métodos existentes com apenas um vigésimo das iterações de treinamento. A abordagem também demonstra eficácia em tarefas de segmentação autossupervisionada de objetos articulados, síntese de novas visões e rastreamento denso de pontos.
English
Persistent dynamic scene modeling for tracking and novel-view synthesis
remains challenging due to the difficulty of capturing accurate deformations
while maintaining computational efficiency. We propose SCas4D, a cascaded
optimization framework that leverages structural patterns in 3D Gaussian
Splatting for dynamic scenes. The key idea is that real-world deformations
often exhibit hierarchical patterns, where groups of Gaussians share similar
transformations. By progressively refining deformations from coarse part-level
to fine point-level, SCas4D achieves convergence within 100 iterations per time
frame and produces results comparable to existing methods with only
one-twentieth of the training iterations. The approach also demonstrates
effectiveness in self-supervised articulated object segmentation, novel view
synthesis, and dense point tracking tasks.