ChatPaper.aiChatPaper

SkeletonGaussian: Bewerkbare 4D-generatie via Gaussiaanse Skeletvorming

SkeletonGaussian: Editable 4D Generation through Gaussian Skeletonization

February 4, 2026
Auteurs: Lifan Wu, Ruijie Zhu, Yubo Ai, Tianzhu Zhang
cs.AI

Samenvatting

4D-generatie heeft opmerkelijke vooruitgang geboekt bij het synthetiseren van dynamische 3D-objecten vanuit invoer zoals tekst, afbeeldingen of video's. Bestaande methoden representeren beweging echter vaak als een impliciet vervormingsveld, wat de directe controle en bewerkbaarheid beperkt. Om dit probleem aan te pakken, stellen wij SkeletonGaussian voor, een nieuw raamwerk voor het genereren van bewerkbare dynamische 3D Gaussians vanuit monocular video-invoer. Onze aanpak introduceert een hiërarchische gearticuleerde representatie die beweging expliciet decomposeert in een schaarse rigide beweging, aangestuurd door een skelet, en fijnmazige niet-rigide beweging. Concreet extraheren we een robuust skelet en sturen de rigide beweging aan via linear blend skinning, gevolgd door een op hexplaten gebaseerde verfijning voor niet-rigide vervormingen, wat de interpreteerbaarheid en bewerkbaarheid verbetert. Experimentele resultaten tonen aan dat SkeletonGaussian de bestaande methoden overtreft in generatiekwaliteit, terwijl het intuïtieve bewegingsbewerking mogelijk maakt, waarmee een nieuw paradigma voor bewerkbare 4D-generatie wordt gevestigd. Projectpagina: https://wusar.github.io/projects/skeletongaussian/
English
4D generation has made remarkable progress in synthesizing dynamic 3D objects from input text, images, or videos. However, existing methods often represent motion as an implicit deformation field, which limits direct control and editability. To address this issue, we propose SkeletonGaussian, a novel framework for generating editable dynamic 3D Gaussians from monocular video input. Our approach introduces a hierarchical articulated representation that decomposes motion into sparse rigid motion explicitly driven by a skeleton and fine-grained non-rigid motion. Concretely, we extract a robust skeleton and drive rigid motion via linear blend skinning, followed by a hexplane-based refinement for non-rigid deformations, enhancing interpretability and editability. Experimental results demonstrate that SkeletonGaussian surpasses existing methods in generation quality while enabling intuitive motion editing, establishing a new paradigm for editable 4D generation. Project page: https://wusar.github.io/projects/skeletongaussian/
PDF11February 6, 2026