ChatPaper.aiChatPaper

AvatarPointilliste : Avatarisation Autoregressive par Gaussiennes 4D

AvatarPointillist: AutoRegressive 4D Gaussian Avatarization

April 6, 2026
Auteurs: Hongyu Liu, Xuan Wang, Yating Wang, Zijian Wu, Ziyu Wan, Yue Ma, Runtao Liu, Boyao Zhou, Yujun Shen, Qifeng Chen
cs.AI

Résumé

Nous présentons AvatarPointillist, une nouvelle méthode pour générer des avatars dynamiques en 4D à partir d'une seule image portrait, basée sur des Gaussiennes. Le cœur de notre approche est un Transformer décodeur-seul qui génère de manière autoregressive un nuage de points pour la technique de *Gaussian Splatting* 3D. Cette approche séquentielle permet une construction précise et adaptative, ajustant dynamiquement la densité des points et leur nombre total en fonction de la complexité du sujet. Durant la génération des points, le modèle AR prédit conjointement les informations de *binding* par point, permettant une animation réaliste. Après la génération, un décodeur Gaussien dédié convertit les points en attributs Gaussiens complets et rendus. Nous démontrons que conditionner le décodeur sur les caractéristiques latentes du générateur AR permet une interaction efficace entre les étapes et améliore notablement la fidélité. Des expériences approfondies valident qu'AvatarPointillist produit des avatars de haute qualité, photoréalistes et contrôlables. Nous pensons que cette formulation autoregressive représente un nouveau paradigme pour la génération d'avatars, et nous publierons notre code pour inspirer les recherches futures.
English
We introduce AvatarPointillist, a novel framework for generating dynamic 4D Gaussian avatars from a single portrait image. At the core of our method is a decoder-only Transformer that autoregressively generates a point cloud for 3D Gaussian Splatting. This sequential approach allows for precise, adaptive construction, dynamically adjusting point density and the total number of points based on the subject's complexity. During point generation, the AR model also jointly predicts per-point binding information, enabling realistic animation. After generation, a dedicated Gaussian decoder converts the points into complete, renderable Gaussian attributes. We demonstrate that conditioning the decoder on the latent features from the AR generator enables effective interaction between stages and markedly improves fidelity. Extensive experiments validate that AvatarPointillist produces high-quality, photorealistic, and controllable avatars. We believe this autoregressive formulation represents a new paradigm for avatar generation, and we will release our code inspire future research.
PDF51April 8, 2026