ChatPaper.aiChatPaper

AvatarPointillist: Autorregresivo Avatarización Gaussiana 4D

AvatarPointillist: AutoRegressive 4D Gaussian Avatarization

April 6, 2026
Autores: Hongyu Liu, Xuan Wang, Yating Wang, Zijian Wu, Ziyu Wan, Yue Ma, Runtao Liu, Boyao Zhou, Yujun Shen, Qifeng Chen
cs.AI

Resumen

Presentamos AvatarPointillist, un novedoso marco de trabajo para generar avatares dinámicos de 4D Gaussianos a partir de una única imagen de retrato. El núcleo de nuestro método es un Transformer de solo decodificación que genera de forma autorregresiva una nube de puntos para *Gaussian Splatting* 3D. Este enfoque secuencial permite una construcción precisa y adaptativa, ajustando dinámicamente la densidad de puntos y el número total de puntos en función de la complejidad del sujeto. Durante la generación de puntos, el modelo AR también predice conjuntamente información de vinculación por punto, lo que permite una animación realista. Tras la generación, un decodificador Gaussiano dedicado convierte los puntos en atributos Gaussianos completos y renderizables. Demostramos que condicionar el decodificador con las características latentes del generador AR permite una interacción efectiva entre etapas y mejora notablemente la fidelidad. Experimentos exhaustivos validan que AvatarPointillist produce avatares de alta calidad, fotorrealistas y controlables. Creemos que esta formulación autorregresiva representa un nuevo paradigma para la generación de avatares, y liberaremos nuestro código para inspirar futuras investigaciones.
English
We introduce AvatarPointillist, a novel framework for generating dynamic 4D Gaussian avatars from a single portrait image. At the core of our method is a decoder-only Transformer that autoregressively generates a point cloud for 3D Gaussian Splatting. This sequential approach allows for precise, adaptive construction, dynamically adjusting point density and the total number of points based on the subject's complexity. During point generation, the AR model also jointly predicts per-point binding information, enabling realistic animation. After generation, a dedicated Gaussian decoder converts the points into complete, renderable Gaussian attributes. We demonstrate that conditioning the decoder on the latent features from the AR generator enables effective interaction between stages and markedly improves fidelity. Extensive experiments validate that AvatarPointillist produces high-quality, photorealistic, and controllable avatars. We believe this autoregressive formulation represents a new paradigm for avatar generation, and we will release our code inspire future research.
PDF51April 8, 2026