ChatPaper.aiChatPaper

SCas4D: Структурная каскадная оптимизация для улучшения устойчивого синтеза новых видов в 4D

SCas4D: Structural Cascaded Optimization for Boosting Persistent 4D Novel View Synthesis

October 8, 2025
Авторы: Jipeng Lyu, Jiahua Dong, Yu-Xiong Wang
cs.AI

Аннотация

Моделирование устойчивых динамических сцен для отслеживания и синтеза новых ракурсов остается сложной задачей из-за трудностей в точном захвате деформаций при сохранении вычислительной эффективности. Мы предлагаем SCas4D, каскадную оптимизационную структуру, которая использует структурные закономерности в 3D-гауссовом сплайнинге для динамических сцен. Ключевая идея заключается в том, что реальные деформации часто демонстрируют иерархические закономерности, при которых группы гауссовых функций разделяют схожие преобразования. Последовательно уточняя деформации от грубого уровня частей до детального уровня точек, SCas4D достигает сходимости в пределах 100 итераций на временной кадр и обеспечивает результаты, сопоставимые с существующими методами, при использовании лишь одной двадцатой части тренировочных итераций. Данный подход также демонстрирует эффективность в задачах самоконтролируемой сегментации сочлененных объектов, синтеза новых ракурсов и плотного отслеживания точек.
English
Persistent dynamic scene modeling for tracking and novel-view synthesis remains challenging due to the difficulty of capturing accurate deformations while maintaining computational efficiency. We propose SCas4D, a cascaded optimization framework that leverages structural patterns in 3D Gaussian Splatting for dynamic scenes. The key idea is that real-world deformations often exhibit hierarchical patterns, where groups of Gaussians share similar transformations. By progressively refining deformations from coarse part-level to fine point-level, SCas4D achieves convergence within 100 iterations per time frame and produces results comparable to existing methods with only one-twentieth of the training iterations. The approach also demonstrates effectiveness in self-supervised articulated object segmentation, novel view synthesis, and dense point tracking tasks.
PDF22October 17, 2025