InfiniHuman : Création infinie d'humains 3D avec un contrôle précis
InfiniHuman: Infinite 3D Human Creation with Precise Control
October 13, 2025
papers.authors: Yuxuan Xue, Xianghui Xie, Margaret Kostyrko, Gerard Pons-Moll
cs.AI
papers.abstract
La génération d'avatars humains 3D réalistes et contrôlables représente un défi de longue date, en particulier lorsqu'il s'agit de couvrir une large gamme d'attributs tels que l'ethnicité, l'âge, les styles vestimentaires et les formes corporelles détaillées. La capture et l'annotation de vastes ensembles de données humaines pour entraîner des modèles génératifs sont extrêmement coûteuses et limitées en termes d'échelle et de diversité. La question centrale que nous abordons dans cet article est la suivante : Les modèles de base existants peuvent-ils être distillés pour générer des données humaines 3D théoriquement illimitées et richement annotées ? Nous présentons InfiniHuman, un cadre qui distille de manière synergique ces modèles pour produire des données humaines richement annotées à un coût minimal et avec une scalabilité théoriquement illimitée. Nous proposons InfiniHumanData, un pipeline entièrement automatique qui exploite des modèles de vision-langage et de génération d'images pour créer un ensemble de données multi-modales à grande échelle. Une étude utilisateur montre que nos identités générées automatiquement sont indiscernables des rendus de scans. InfiniHumanData contient 111 000 identités couvrant une diversité sans précédent. Chaque identité est annotée avec des descriptions textuelles multi-granularités, des images RGB multi-vues, des images détaillées de vêtements et des paramètres de forme corporelle SMPL. Sur la base de cet ensemble de données, nous proposons InfiniHumanGen, un pipeline génératif basé sur la diffusion conditionné par du texte, la forme corporelle et des éléments vestimentaires. InfiniHumanGen permet une génération rapide, réaliste et précisément contrôlable d'avatars. Des expériences approfondies démontrent des améliorations significatives par rapport aux méthodes de pointe en termes de qualité visuelle, de vitesse de génération et de contrôlabilité. Notre approche permet une génération d'avatars de haute qualité avec un contrôle granulaire à une échelle pratiquement illimitée, grâce à une solution pratique et abordable. Nous rendrons publics le pipeline de génération automatique de données, l'ensemble de données complet InfiniHumanData et les modèles InfiniHumanGen à l'adresse suivante : https://yuxuan-xue.com/infini-human.
English
Generating realistic and controllable 3D human avatars is a long-standing
challenge, particularly when covering broad attribute ranges such as ethnicity,
age, clothing styles, and detailed body shapes. Capturing and annotating
large-scale human datasets for training generative models is prohibitively
expensive and limited in scale and diversity. The central question we address
in this paper is: Can existing foundation models be distilled to generate
theoretically unbounded, richly annotated 3D human data? We introduce
InfiniHuman, a framework that synergistically distills these models to produce
richly annotated human data at minimal cost and with theoretically unlimited
scalability. We propose InfiniHumanData, a fully automatic pipeline that
leverages vision-language and image generation models to create a large-scale
multi-modal dataset. User study shows our automatically generated identities
are undistinguishable from scan renderings. InfiniHumanData contains 111K
identities spanning unprecedented diversity. Each identity is annotated with
multi-granularity text descriptions, multi-view RGB images, detailed clothing
images, and SMPL body-shape parameters. Building on this dataset, we propose
InfiniHumanGen, a diffusion-based generative pipeline conditioned on text, body
shape, and clothing assets. InfiniHumanGen enables fast, realistic, and
precisely controllable avatar generation. Extensive experiments demonstrate
significant improvements over state-of-the-art methods in visual quality,
generation speed, and controllability. Our approach enables high-quality avatar
generation with fine-grained control at effectively unbounded scale through a
practical and affordable solution. We will publicly release the automatic data
generation pipeline, the comprehensive InfiniHumanData dataset, and the
InfiniHumanGen models at https://yuxuan-xue.com/infini-human.