ChatPaper.aiChatPaper

SkeletonGaussian: Редактируемая 4D-генерация посредством гауссовой скелетизации

SkeletonGaussian: Editable 4D Generation through Gaussian Skeletonization

February 4, 2026
Авторы: Lifan Wu, Ruijie Zhu, Yubo Ai, Tianzhu Zhang
cs.AI

Аннотация

Генерация 4D-контента достигла значительного прогресса в синтезе динамических 3D-объектов из входного текста, изображений или видео. Однако существующие методы часто представляют движение как неявное поле деформации, что ограничивает прямое управление и редактируемость. Для решения этой проблемы мы предлагаем SkeletonGaussian — новый фреймворк для генерации редактируемых динамических 3D-гаусссианов из монокулярного видео. Наш подход вводит иерархическое артикулированное представление, которое декомпозирует движение на разреженное жесткое движение, явно управляемое скелетом, и мелкозернистое нежесткое движение. Конкретно, мы извлекаем устойчивый скелет и управляем жестким движением с помощью линейной скиннинговой деформации, после чего применяем основанное на гексаплейнах уточнение для нежестких деформаций, повышая интерпретируемость и редактируемость. Результаты экспериментов показывают, что SkeletonGaussian превосходит существующие методы по качеству генерации, обеспечивая при этом интуитивное редактирование движения, и устанавливает новую парадигму для редактируемой 4D-генерации. Страница проекта: https://wusar.github.io/projects/skeletongaussian/
English
4D generation has made remarkable progress in synthesizing dynamic 3D objects from input text, images, or videos. However, existing methods often represent motion as an implicit deformation field, which limits direct control and editability. To address this issue, we propose SkeletonGaussian, a novel framework for generating editable dynamic 3D Gaussians from monocular video input. Our approach introduces a hierarchical articulated representation that decomposes motion into sparse rigid motion explicitly driven by a skeleton and fine-grained non-rigid motion. Concretely, we extract a robust skeleton and drive rigid motion via linear blend skinning, followed by a hexplane-based refinement for non-rigid deformations, enhancing interpretability and editability. Experimental results demonstrate that SkeletonGaussian surpasses existing methods in generation quality while enabling intuitive motion editing, establishing a new paradigm for editable 4D generation. Project page: https://wusar.github.io/projects/skeletongaussian/
PDF11February 6, 2026