ChatPaper.aiChatPaper

SkeletonGaussian: Generación 4D Editable mediante Esqueletización Gaussiana

SkeletonGaussian: Editable 4D Generation through Gaussian Skeletonization

February 4, 2026
Autores: Lifan Wu, Ruijie Zhu, Yubo Ai, Tianzhu Zhang
cs.AI

Resumen

La generación 4D ha logrado un progreso notable en la síntesis de objetos 3D dinámicos a partir de texto, imágenes o vídeos de entrada. Sin embargo, los métodos existentes suelen representar el movimiento como un campo de deformación implícito, lo que limita el control directo y la capacidad de edición. Para abordar este problema, proponemos SkeletonGaussian, un novedoso marco de trabajo para generar Gaussianas 3D dinámicas y editables a partir de vídeos monoculares. Nuestro enfoque introduce una representación articulada jerárquica que descompone el movimiento en un movimiento rígido disperso, impulsado explícitamente por un esqueleto, y un movimiento no rígido de grano fino. Concretamente, extraemos un esqueleto robusto y accionamos el movimiento rígido mediante *linear blend skinning*, seguido de un refinamiento basado en hexplanos para las deformaciones no rígidas, mejorando la interpretabilidad y la editabilidad. Los resultados experimentales demuestran que SkeletonGaussian supera a los métodos existentes en calidad de generación, a la vez que permite una edición intuitiva del movimiento, estableciendo un nuevo paradigma para la generación 4D editable. Página del proyecto: https://wusar.github.io/projects/skeletongaussian/
English
4D generation has made remarkable progress in synthesizing dynamic 3D objects from input text, images, or videos. However, existing methods often represent motion as an implicit deformation field, which limits direct control and editability. To address this issue, we propose SkeletonGaussian, a novel framework for generating editable dynamic 3D Gaussians from monocular video input. Our approach introduces a hierarchical articulated representation that decomposes motion into sparse rigid motion explicitly driven by a skeleton and fine-grained non-rigid motion. Concretely, we extract a robust skeleton and drive rigid motion via linear blend skinning, followed by a hexplane-based refinement for non-rigid deformations, enhancing interpretability and editability. Experimental results demonstrate that SkeletonGaussian surpasses existing methods in generation quality while enabling intuitive motion editing, establishing a new paradigm for editable 4D generation. Project page: https://wusar.github.io/projects/skeletongaussian/
PDF11February 6, 2026