SkeletonGaussian : Génération 4D modifiable par squelettisation Gaussienne
SkeletonGaussian: Editable 4D Generation through Gaussian Skeletonization
February 4, 2026
papers.authors: Lifan Wu, Ruijie Zhu, Yubo Ai, Tianzhu Zhang
cs.AI
papers.abstract
La génération 4D a réalisé des progrès remarquables dans la synthèse d'objets 3D dynamiques à partir de texte, d'images ou de vidéos. Cependant, les méthodes existantes représentent souvent le mouvement comme un champ de déformation implicite, ce qui limite le contrôle direct et la capacité d'édition. Pour résoudre ce problème, nous proposons SkeletonGaussian, un nouveau cadre pour générer des Gaussiennes 3D dynamiques et éditables à partir d'une vidéo monoculaire. Notre approche introduit une représentation articulée hiérarchique qui décompose le mouvement en un mouvement rigide épars, explicitement piloté par un squelette, et un mouvement non rigide à grain fin. Concrètement, nous extrayons un squelette robuste et pilotons le mouvement rigide via le *linear blend skinning*, suivi d'un raffinement basé sur des hexplanes pour les déformations non rigides, améliorant ainsi l'interprétabilité et l'éditabilité. Les résultats expérimentaux démontrent que SkeletonGaussian surpasse les méthodes existantes en qualité de génération tout en permettant une édition intuitive du mouvement, établissant un nouveau paradigme pour la génération 4D éditable. Page du projet : https://wusar.github.io/projects/skeletongaussian/
English
4D generation has made remarkable progress in synthesizing dynamic 3D objects from input text, images, or videos. However, existing methods often represent motion as an implicit deformation field, which limits direct control and editability. To address this issue, we propose SkeletonGaussian, a novel framework for generating editable dynamic 3D Gaussians from monocular video input. Our approach introduces a hierarchical articulated representation that decomposes motion into sparse rigid motion explicitly driven by a skeleton and fine-grained non-rigid motion. Concretely, we extract a robust skeleton and drive rigid motion via linear blend skinning, followed by a hexplane-based refinement for non-rigid deformations, enhancing interpretability and editability. Experimental results demonstrate that SkeletonGaussian surpasses existing methods in generation quality while enabling intuitive motion editing, establishing a new paradigm for editable 4D generation. Project page: https://wusar.github.io/projects/skeletongaussian/