ChatPaper.aiChatPaper

InfiniHuman: Creazione Infinita di Umani 3D con Controllo Preciso

InfiniHuman: Infinite 3D Human Creation with Precise Control

October 13, 2025
Autori: Yuxuan Xue, Xianghui Xie, Margaret Kostyrko, Gerard Pons-Moll
cs.AI

Abstract

Generare avatar umani 3D realistici e controllabili rappresenta una sfida di lunga data, in particolare quando si coprono ampi intervalli di attributi come etnia, età, stili di abbigliamento e forme corporee dettagliate. Acquisire e annotare dataset umani su larga scala per addestrare modelli generativi è proibitivamente costoso e limitato in termini di scala e diversità. La domanda centrale che affrontiamo in questo articolo è: È possibile distillare modelli di base esistenti per generare dati umani 3D teoricamente illimitati e riccamente annotati? Introduciamo InfiniHuman, un framework che sinergicamente distilla questi modelli per produrre dati umani riccamente annotati a costi minimi e con una scalabilità teoricamente illimitata. Proponiamo InfiniHumanData, una pipeline completamente automatica che sfrutta modelli di visione-linguaggio e generazione di immagini per creare un dataset multi-modale su larga scala. Uno studio con utenti dimostra che le identità generate automaticamente sono indistinguibili dalle renderizzazioni di scansioni. InfiniHumanData contiene 111K identità che coprono una diversità senza precedenti. Ogni identità è annotata con descrizioni testuali multi-granularità, immagini RGB multi-vista, immagini dettagliate dell'abbigliamento e parametri di forma corporea SMPL. Basandoci su questo dataset, proponiamo InfiniHumanGen, una pipeline generativa basata su diffusione condizionata da testo, forma corporea e asset di abbigliamento. InfiniHumanGen consente una generazione rapida, realistica e precisamente controllabile di avatar. Esperimenti estensivi dimostrano miglioramenti significativi rispetto ai metodi all'avanguardia in termini di qualità visiva, velocità di generazione e controllabilità. Il nostro approccio abilita la generazione di avatar di alta qualità con un controllo fine a una scala effettivamente illimitata attraverso una soluzione pratica e accessibile. Rilasceremo pubblicamente la pipeline automatica di generazione dati, il dataset completo InfiniHumanData e i modelli InfiniHumanGen su https://yuxuan-xue.com/infini-human.
English
Generating realistic and controllable 3D human avatars is a long-standing challenge, particularly when covering broad attribute ranges such as ethnicity, age, clothing styles, and detailed body shapes. Capturing and annotating large-scale human datasets for training generative models is prohibitively expensive and limited in scale and diversity. The central question we address in this paper is: Can existing foundation models be distilled to generate theoretically unbounded, richly annotated 3D human data? We introduce InfiniHuman, a framework that synergistically distills these models to produce richly annotated human data at minimal cost and with theoretically unlimited scalability. We propose InfiniHumanData, a fully automatic pipeline that leverages vision-language and image generation models to create a large-scale multi-modal dataset. User study shows our automatically generated identities are undistinguishable from scan renderings. InfiniHumanData contains 111K identities spanning unprecedented diversity. Each identity is annotated with multi-granularity text descriptions, multi-view RGB images, detailed clothing images, and SMPL body-shape parameters. Building on this dataset, we propose InfiniHumanGen, a diffusion-based generative pipeline conditioned on text, body shape, and clothing assets. InfiniHumanGen enables fast, realistic, and precisely controllable avatar generation. Extensive experiments demonstrate significant improvements over state-of-the-art methods in visual quality, generation speed, and controllability. Our approach enables high-quality avatar generation with fine-grained control at effectively unbounded scale through a practical and affordable solution. We will publicly release the automatic data generation pipeline, the comprehensive InfiniHumanData dataset, and the InfiniHumanGen models at https://yuxuan-xue.com/infini-human.
PDF52October 14, 2025