ChatPaper.aiChatPaper

AvatarPointillist: Autoregressieve 4D Gaussian-avatarisatie

AvatarPointillist: AutoRegressive 4D Gaussian Avatarization

April 6, 2026
Auteurs: Hongyu Liu, Xuan Wang, Yating Wang, Zijian Wu, Ziyu Wan, Yue Ma, Runtao Liu, Boyao Zhou, Yujun Shen, Qifeng Chen
cs.AI

Samenvatting

Wij introduceren AvatarPointillist, een nieuw raamwerk voor het genereren van dynamische 4D Gaussian-avatars vanuit een enkele portretfoto. De kern van onze methode is een decoder-only Transformer die autoregressief een pointcloud genereert voor 3D Gaussian Splatting. Deze sequentiële aanpak maakt een precieze, adaptieve constructie mogelijk, waarbij de puntdichtheid en het totale aantal punten dynamisch worden aangepast op basis van de complexiteit van het onderwerp. Tijdens de puntgeneratie voorspelt het AR-model ook gezamenlijk de bindingsinformatie per punt, wat realistische animatie mogelijk maakt. Na de generatie zet een speciale Gaussian-decoder de punten om in complete, renderbare Gaussian-attributen. Wij tonen aan dat conditionering van de decoder op de latente kenmerken van de AR-generator een effectieve interactie tussen de fasen mogelijk maakt en de getrouwheid aanzienlijk verbetert. Uitgebreide experimenten valideren dat AvatarPointillist hoogwaardige, fotorealistische en bestuurbare avatars produceert. Wij geloven dat deze autoregressieve formulering een nieuw paradigma vertegenwoordigt voor avatargeneratie, en wij zullen onze code vrijgeven om toekomstig onderzoek te inspireren.
English
We introduce AvatarPointillist, a novel framework for generating dynamic 4D Gaussian avatars from a single portrait image. At the core of our method is a decoder-only Transformer that autoregressively generates a point cloud for 3D Gaussian Splatting. This sequential approach allows for precise, adaptive construction, dynamically adjusting point density and the total number of points based on the subject's complexity. During point generation, the AR model also jointly predicts per-point binding information, enabling realistic animation. After generation, a dedicated Gaussian decoder converts the points into complete, renderable Gaussian attributes. We demonstrate that conditioning the decoder on the latent features from the AR generator enables effective interaction between stages and markedly improves fidelity. Extensive experiments validate that AvatarPointillist produces high-quality, photorealistic, and controllable avatars. We believe this autoregressive formulation represents a new paradigm for avatar generation, and we will release our code inspire future research.
PDF51April 8, 2026