SkeletonGaussian: Generazione 4D Editabile tramite Scheletrizzazione Gaussiana
SkeletonGaussian: Editable 4D Generation through Gaussian Skeletonization
February 4, 2026
Autori: Lifan Wu, Ruijie Zhu, Yubo Ai, Tianzhu Zhang
cs.AI
Abstract
La generazione 4D ha compiuto progressi notevoli nella sintesi di oggetti 3D dinamici a partire da testo, immagini o video in input. Tuttavia, i metodi esistenti rappresentano spesso il movimento come un campo di deformazione implicito, il che limita il controllo diretto e l'editabilità. Per affrontare questo problema, proponiamo SkeletonGaussian, un nuovo framework per generare Gaussiane 3D dinamiche e modificabili a partire da video monoculare. Il nostro approccio introduce una rappresentazione articolata gerarchica che scompone il movimento in un movimento rigido sparso guidato esplicitamente da uno scheletro e in un movimento non rigido di dettaglio. Nello specifico, estraiamo uno scheletro robusto e guidiamo il movimento rigido tramite linear blend skinning, seguito da un raffinamento basato su hexplane per le deformazioni non rigide, migliorando l'interpretabilità e l'editabilità. I risultati sperimentali dimostrano che SkeletonGaussian supera i metodi esistenti in qualità di generazione, consentendo al contempo un'editing intuitivo del movimento, stabilendo un nuovo paradigma per la generazione 4D modificabile. Pagina del progetto: https://wusar.github.io/projects/skeletongaussian/
English
4D generation has made remarkable progress in synthesizing dynamic 3D objects from input text, images, or videos. However, existing methods often represent motion as an implicit deformation field, which limits direct control and editability. To address this issue, we propose SkeletonGaussian, a novel framework for generating editable dynamic 3D Gaussians from monocular video input. Our approach introduces a hierarchical articulated representation that decomposes motion into sparse rigid motion explicitly driven by a skeleton and fine-grained non-rigid motion. Concretely, we extract a robust skeleton and drive rigid motion via linear blend skinning, followed by a hexplane-based refinement for non-rigid deformations, enhancing interpretability and editability. Experimental results demonstrate that SkeletonGaussian surpasses existing methods in generation quality while enabling intuitive motion editing, establishing a new paradigm for editable 4D generation. Project page: https://wusar.github.io/projects/skeletongaussian/