ChatPaper.aiChatPaper

AvatarPointillist: Autoregressive 4D-Gaußsche Avatarisierung

AvatarPointillist: AutoRegressive 4D Gaussian Avatarization

April 6, 2026
Autoren: Hongyu Liu, Xuan Wang, Yating Wang, Zijian Wu, Ziyu Wan, Yue Ma, Runtao Liu, Boyao Zhou, Yujun Shen, Qifeng Chen
cs.AI

Zusammenfassung

Wir stellen AvatarPointillist vor, ein neuartiges Framework zur Erzeugung dynamischer 4D-Gaussian-Avatare aus einem einzelnen Porträtbild. Kern unserer Methode ist ein Decoder-Only-Transformer, der autoregressiv eine Punktwolke für 3D Gaussian Splatting generiert. Dieser sequenzielle Ansatz ermöglicht eine präzise, adaptive Konstruktion, die die Punktdichte und die Gesamtpunktzahl dynamisch an die Komplexität des Subjekts anpasst. Während der Punkterzeugung sagt das AR-Modell gleichzeitig Bindungsinformationen pro Punkt voraus, was eine realistische Animation ermöglicht. Nach der Generierung konvertiert ein spezieller Gaussian-Decoder die Punkte in vollständige, renderfähige Gaussian-Attribute. Wir zeigen, dass die Konditionierung des Decoders auf die latenten Merkmale des AR-Generators eine effektive Interaktion zwischen den Stufen ermöglicht und die Detailtreue deutlich verbessert. Umfangreiche Experimente bestätigen, dass AvatarPointillist hochwertige, fotorealistische und steuerbare Avatare erzeugt. Wir sind überzeugt, dass diese autoregressive Formulierung ein neues Paradigma für die Avatar-Erzeugung darstellt, und wir werden unseren Code veröffentlichen, um zukünftige Forschung zu inspirieren.
English
We introduce AvatarPointillist, a novel framework for generating dynamic 4D Gaussian avatars from a single portrait image. At the core of our method is a decoder-only Transformer that autoregressively generates a point cloud for 3D Gaussian Splatting. This sequential approach allows for precise, adaptive construction, dynamically adjusting point density and the total number of points based on the subject's complexity. During point generation, the AR model also jointly predicts per-point binding information, enabling realistic animation. After generation, a dedicated Gaussian decoder converts the points into complete, renderable Gaussian attributes. We demonstrate that conditioning the decoder on the latent features from the AR generator enables effective interaction between stages and markedly improves fidelity. Extensive experiments validate that AvatarPointillist produces high-quality, photorealistic, and controllable avatars. We believe this autoregressive formulation represents a new paradigm for avatar generation, and we will release our code inspire future research.
PDF51April 8, 2026