ChatPaper.aiChatPaper

AvatarArtist: Creación de Avatares 4D de Dominio Abierto

AvatarArtist: Open-Domain 4D Avatarization

March 25, 2025
Autores: Hongyu Liu, Xuan Wang, Ziyu Wan, Yue Ma, Jingye Chen, Yanbo Fan, Yujun Shen, Yibing Song, Qifeng Chen
cs.AI

Resumen

Este trabajo se centra en la avatarización 4D de dominio abierto, con el objetivo de crear un avatar 4D a partir de una imagen de retrato en un estilo arbitrario. Seleccionamos triplanos paramétricos como la representación intermedia 4D y proponemos un paradigma de entrenamiento práctico que aprovecha tanto las redes generativas adversarias (GANs) como los modelos de difusión. Nuestro diseño surge de la observación de que las GANs 4D sobresalen en conectar imágenes y triplanos sin supervisión, pero suelen enfrentar desafíos al manejar distribuciones de datos diversas. Un robusto prior de difusión 2D emerge como la solución, ayudando a la GAN a transferir su experiencia a través de diversos dominios. La sinergia entre estos expertos permite la construcción de un conjunto de datos de imágenes-triplanos multidominio, lo que impulsa el desarrollo de un creador de avatares 4D general. Experimentos exhaustivos sugieren que nuestro modelo, AvatarArtist, es capaz de producir avatares 4D de alta calidad con una fuerte robustez frente a diversos dominios de imágenes fuente. El código, los datos y los modelos se pondrán a disposición del público para facilitar estudios futuros.
English
This work focuses on open-domain 4D avatarization, with the purpose of creating a 4D avatar from a portrait image in an arbitrary style. We select parametric triplanes as the intermediate 4D representation and propose a practical training paradigm that takes advantage of both generative adversarial networks (GANs) and diffusion models. Our design stems from the observation that 4D GANs excel at bridging images and triplanes without supervision yet usually face challenges in handling diverse data distributions. A robust 2D diffusion prior emerges as the solution, assisting the GAN in transferring its expertise across various domains. The synergy between these experts permits the construction of a multi-domain image-triplane dataset, which drives the development of a general 4D avatar creator. Extensive experiments suggest that our model, AvatarArtist, is capable of producing high-quality 4D avatars with strong robustness to various source image domains. The code, the data, and the models will be made publicly available to facilitate future studies..

Summary

AI-Generated Summary

PDF92April 1, 2025