SCas4D: Структурная каскадная оптимизация для улучшения устойчивого синтеза новых видов в 4D
SCas4D: Structural Cascaded Optimization for Boosting Persistent 4D Novel View Synthesis
October 8, 2025
Авторы: Jipeng Lyu, Jiahua Dong, Yu-Xiong Wang
cs.AI
Аннотация
Моделирование устойчивых динамических сцен для отслеживания и синтеза новых ракурсов остается сложной задачей из-за трудностей в точном захвате деформаций при сохранении вычислительной эффективности. Мы предлагаем SCas4D, каскадную оптимизационную структуру, которая использует структурные закономерности в 3D-гауссовом сплайнинге для динамических сцен. Ключевая идея заключается в том, что реальные деформации часто демонстрируют иерархические закономерности, при которых группы гауссовых функций разделяют схожие преобразования. Последовательно уточняя деформации от грубого уровня частей до детального уровня точек, SCas4D достигает сходимости в пределах 100 итераций на временной кадр и обеспечивает результаты, сопоставимые с существующими методами, при использовании лишь одной двадцатой части тренировочных итераций. Данный подход также демонстрирует эффективность в задачах самоконтролируемой сегментации сочлененных объектов, синтеза новых ракурсов и плотного отслеживания точек.
English
Persistent dynamic scene modeling for tracking and novel-view synthesis
remains challenging due to the difficulty of capturing accurate deformations
while maintaining computational efficiency. We propose SCas4D, a cascaded
optimization framework that leverages structural patterns in 3D Gaussian
Splatting for dynamic scenes. The key idea is that real-world deformations
often exhibit hierarchical patterns, where groups of Gaussians share similar
transformations. By progressively refining deformations from coarse part-level
to fine point-level, SCas4D achieves convergence within 100 iterations per time
frame and produces results comparable to existing methods with only
one-twentieth of the training iterations. The approach also demonstrates
effectiveness in self-supervised articulated object segmentation, novel view
synthesis, and dense point tracking tasks.