SCas4D: Structurele Gecascadeerde Optimalisatie voor het Verbeteren van Persistente 4D Nieuwe Beeldsynthese
SCas4D: Structural Cascaded Optimization for Boosting Persistent 4D Novel View Synthesis
October 8, 2025
Auteurs: Jipeng Lyu, Jiahua Dong, Yu-Xiong Wang
cs.AI
Samenvatting
Persistente dynamische scènemodellering voor tracking en synthese van nieuwe gezichtspunten blijft uitdagend vanwege de moeilijkheid om nauwkeurige vervormingen vast te leggen terwijl de rekenkundige efficiëntie behouden blijft. Wij stellen SCas4D voor, een gecascadeerd optimalisatiekader dat gebruikmaakt van structurele patronen in 3D Gaussian Splatting voor dynamische scènes. Het kernidee is dat vervormingen in de echte wereld vaak hiërarchische patronen vertonen, waarbij groepen van Gaussiaanse verdelingen vergelijkbare transformaties delen. Door vervormingen progressief te verfijnen van grof op deelniveau naar fijn op puntniveau, bereikt SCas4D convergentie binnen 100 iteraties per tijdseenheid en produceert het resultaten die vergelijkbaar zijn met bestaande methoden met slechts een twintigste van de trainingsiteraties. De aanpak toont ook effectiviteit in zelfgesuperviseerde segmentatie van gearticuleerde objecten, synthese van nieuwe gezichtspunten en taken voor dichte punt-tracking.
English
Persistent dynamic scene modeling for tracking and novel-view synthesis
remains challenging due to the difficulty of capturing accurate deformations
while maintaining computational efficiency. We propose SCas4D, a cascaded
optimization framework that leverages structural patterns in 3D Gaussian
Splatting for dynamic scenes. The key idea is that real-world deformations
often exhibit hierarchical patterns, where groups of Gaussians share similar
transformations. By progressively refining deformations from coarse part-level
to fine point-level, SCas4D achieves convergence within 100 iterations per time
frame and produces results comparable to existing methods with only
one-twentieth of the training iterations. The approach also demonstrates
effectiveness in self-supervised articulated object segmentation, novel view
synthesis, and dense point tracking tasks.