AvatarPointillist: Avatarização Autoregressiva com Gaussianas 4D
AvatarPointillist: AutoRegressive 4D Gaussian Avatarization
April 6, 2026
Autores: Hongyu Liu, Xuan Wang, Yating Wang, Zijian Wu, Ziyu Wan, Yue Ma, Runtao Liu, Boyao Zhou, Yujun Shen, Qifeng Chen
cs.AI
Resumo
Apresentamos o AvatarPointillist, uma nova estrutura para geração de avatares dinâmicos de 4D Gaussianos a partir de uma única imagem de retrato. O cerne do nosso método é um Transformer apenas-decodificador que gera autoregressivamente uma nuvem de pontos para *Gaussian Splatting* 3D. Esta abordagem sequencial permite uma construção precisa e adaptativa, ajustando dinamicamente a densidade de pontos e o número total de pontos com base na complexidade do sujeito. Durante a geração de pontos, o modelo AR também prevê conjuntamente informações de vinculação por ponto, permitindo uma animação realista. Após a geração, um decodificador Gaussiano dedicado converte os pontos em atributos Gaussianos completos e renderizáveis. Demonstramos que condicionar o decodificador nas características latentes do gerador AR permite uma interação eficaz entre os estágios e melhora marcadamente a fidelidade. Experimentos extensivos validam que o AvatarPointillist produz avatares de alta qualidade, fotorrealistas e controláveis. Acreditamos que esta formulação autoregressiva representa um novo paradigma para a geração de avatares, e iremos disponibilizar nosso código para inspirar pesquisas futuras.
English
We introduce AvatarPointillist, a novel framework for generating dynamic 4D Gaussian avatars from a single portrait image. At the core of our method is a decoder-only Transformer that autoregressively generates a point cloud for 3D Gaussian Splatting. This sequential approach allows for precise, adaptive construction, dynamically adjusting point density and the total number of points based on the subject's complexity. During point generation, the AR model also jointly predicts per-point binding information, enabling realistic animation. After generation, a dedicated Gaussian decoder converts the points into complete, renderable Gaussian attributes. We demonstrate that conditioning the decoder on the latent features from the AR generator enables effective interaction between stages and markedly improves fidelity. Extensive experiments validate that AvatarPointillist produces high-quality, photorealistic, and controllable avatars. We believe this autoregressive formulation represents a new paradigm for avatar generation, and we will release our code inspire future research.