InfiniHuman: Unendliche 3D-Mensch-Erstellung mit präziser Steuerung
InfiniHuman: Infinite 3D Human Creation with Precise Control
October 13, 2025
papers.authors: Yuxuan Xue, Xianghui Xie, Margaret Kostyrko, Gerard Pons-Moll
cs.AI
papers.abstract
Die Erzeugung realistischer und kontrollierbarer 3D-Menschavatare stellt eine langjährige Herausforderung dar, insbesondere wenn ein breites Spektrum an Attributen wie Ethnizität, Alter, Kleidungsstile und detaillierte Körperformen abgedeckt werden soll. Die Erfassung und Annotation groß angelegter menschlicher Datensätze für das Training generativer Modelle ist äußerst kostspielig und in Umfang und Vielfalt begrenzt. Die zentrale Frage, die wir in diesem Artikel behandeln, lautet: Können bestehende Foundation-Modelle so destilliert werden, dass sie theoretisch unbegrenzte, reich annotierte 3D-Menschdaten erzeugen? Wir stellen InfiniHuman vor, ein Framework, das diese Modelle synergetisch destilliert, um reich annotierte Menschdaten mit minimalen Kosten und theoretisch unbegrenzter Skalierbarkeit zu erzeugen. Wir präsentieren InfiniHumanData, eine vollautomatische Pipeline, die Vision-Language- und Bildgenerierungsmodelle nutzt, um einen groß angelegten multimodalen Datensatz zu erstellen. Eine Nutzerstudie zeigt, dass unsere automatisch generierten Identitäten nicht von Scan-Renderings zu unterscheiden sind. InfiniHumanData umfasst 111.000 Identitäten mit einer beispiellosen Vielfalt. Jede Identität ist mit mehrgranularen Textbeschreibungen, Mehransicht-RGB-Bildern, detaillierten Kleidungsbildern und SMPL-Körperformparametern annotiert. Aufbauend auf diesem Datensatz schlagen wir InfiniHumanGen vor, eine diffusionsbasierte generative Pipeline, die auf Text, Körperform und Kleidungsassets konditioniert ist. InfiniHumanGen ermöglicht eine schnelle, realistische und präzise kontrollierbare Avatar-Generierung. Umfangreiche Experimente zeigen signifikante Verbesserungen gegenüber state-of-the-art-Methoden in Bezug auf visuelle Qualität, Generierungsgeschwindigkeit und Kontrollierbarkeit. Unser Ansatz ermöglicht die Erzeugung hochwertiger Avatare mit fein abgestufter Kontrolle in praktisch unbegrenztem Umfang durch eine praktische und kostengünstige Lösung. Wir werden die automatische Datengenerierungspipeline, den umfassenden InfiniHumanData-Datensatz und die InfiniHumanGen-Modelle öffentlich unter https://yuxuan-xue.com/infini-human freigeben.
English
Generating realistic and controllable 3D human avatars is a long-standing
challenge, particularly when covering broad attribute ranges such as ethnicity,
age, clothing styles, and detailed body shapes. Capturing and annotating
large-scale human datasets for training generative models is prohibitively
expensive and limited in scale and diversity. The central question we address
in this paper is: Can existing foundation models be distilled to generate
theoretically unbounded, richly annotated 3D human data? We introduce
InfiniHuman, a framework that synergistically distills these models to produce
richly annotated human data at minimal cost and with theoretically unlimited
scalability. We propose InfiniHumanData, a fully automatic pipeline that
leverages vision-language and image generation models to create a large-scale
multi-modal dataset. User study shows our automatically generated identities
are undistinguishable from scan renderings. InfiniHumanData contains 111K
identities spanning unprecedented diversity. Each identity is annotated with
multi-granularity text descriptions, multi-view RGB images, detailed clothing
images, and SMPL body-shape parameters. Building on this dataset, we propose
InfiniHumanGen, a diffusion-based generative pipeline conditioned on text, body
shape, and clothing assets. InfiniHumanGen enables fast, realistic, and
precisely controllable avatar generation. Extensive experiments demonstrate
significant improvements over state-of-the-art methods in visual quality,
generation speed, and controllability. Our approach enables high-quality avatar
generation with fine-grained control at effectively unbounded scale through a
practical and affordable solution. We will publicly release the automatic data
generation pipeline, the comprehensive InfiniHumanData dataset, and the
InfiniHumanGen models at https://yuxuan-xue.com/infini-human.