ChatPaper.aiChatPaper

InfiniHuman: Unendliche 3D-Mensch-Erstellung mit präziser Steuerung

InfiniHuman: Infinite 3D Human Creation with Precise Control

October 13, 2025
papers.authors: Yuxuan Xue, Xianghui Xie, Margaret Kostyrko, Gerard Pons-Moll
cs.AI

papers.abstract

Die Erzeugung realistischer und kontrollierbarer 3D-Menschavatare stellt eine langjährige Herausforderung dar, insbesondere wenn ein breites Spektrum an Attributen wie Ethnizität, Alter, Kleidungsstile und detaillierte Körperformen abgedeckt werden soll. Die Erfassung und Annotation groß angelegter menschlicher Datensätze für das Training generativer Modelle ist äußerst kostspielig und in Umfang und Vielfalt begrenzt. Die zentrale Frage, die wir in diesem Artikel behandeln, lautet: Können bestehende Foundation-Modelle so destilliert werden, dass sie theoretisch unbegrenzte, reich annotierte 3D-Menschdaten erzeugen? Wir stellen InfiniHuman vor, ein Framework, das diese Modelle synergetisch destilliert, um reich annotierte Menschdaten mit minimalen Kosten und theoretisch unbegrenzter Skalierbarkeit zu erzeugen. Wir präsentieren InfiniHumanData, eine vollautomatische Pipeline, die Vision-Language- und Bildgenerierungsmodelle nutzt, um einen groß angelegten multimodalen Datensatz zu erstellen. Eine Nutzerstudie zeigt, dass unsere automatisch generierten Identitäten nicht von Scan-Renderings zu unterscheiden sind. InfiniHumanData umfasst 111.000 Identitäten mit einer beispiellosen Vielfalt. Jede Identität ist mit mehrgranularen Textbeschreibungen, Mehransicht-RGB-Bildern, detaillierten Kleidungsbildern und SMPL-Körperformparametern annotiert. Aufbauend auf diesem Datensatz schlagen wir InfiniHumanGen vor, eine diffusionsbasierte generative Pipeline, die auf Text, Körperform und Kleidungsassets konditioniert ist. InfiniHumanGen ermöglicht eine schnelle, realistische und präzise kontrollierbare Avatar-Generierung. Umfangreiche Experimente zeigen signifikante Verbesserungen gegenüber state-of-the-art-Methoden in Bezug auf visuelle Qualität, Generierungsgeschwindigkeit und Kontrollierbarkeit. Unser Ansatz ermöglicht die Erzeugung hochwertiger Avatare mit fein abgestufter Kontrolle in praktisch unbegrenztem Umfang durch eine praktische und kostengünstige Lösung. Wir werden die automatische Datengenerierungspipeline, den umfassenden InfiniHumanData-Datensatz und die InfiniHumanGen-Modelle öffentlich unter https://yuxuan-xue.com/infini-human freigeben.
English
Generating realistic and controllable 3D human avatars is a long-standing challenge, particularly when covering broad attribute ranges such as ethnicity, age, clothing styles, and detailed body shapes. Capturing and annotating large-scale human datasets for training generative models is prohibitively expensive and limited in scale and diversity. The central question we address in this paper is: Can existing foundation models be distilled to generate theoretically unbounded, richly annotated 3D human data? We introduce InfiniHuman, a framework that synergistically distills these models to produce richly annotated human data at minimal cost and with theoretically unlimited scalability. We propose InfiniHumanData, a fully automatic pipeline that leverages vision-language and image generation models to create a large-scale multi-modal dataset. User study shows our automatically generated identities are undistinguishable from scan renderings. InfiniHumanData contains 111K identities spanning unprecedented diversity. Each identity is annotated with multi-granularity text descriptions, multi-view RGB images, detailed clothing images, and SMPL body-shape parameters. Building on this dataset, we propose InfiniHumanGen, a diffusion-based generative pipeline conditioned on text, body shape, and clothing assets. InfiniHumanGen enables fast, realistic, and precisely controllable avatar generation. Extensive experiments demonstrate significant improvements over state-of-the-art methods in visual quality, generation speed, and controllability. Our approach enables high-quality avatar generation with fine-grained control at effectively unbounded scale through a practical and affordable solution. We will publicly release the automatic data generation pipeline, the comprehensive InfiniHumanData dataset, and the InfiniHumanGen models at https://yuxuan-xue.com/infini-human.
PDF52October 14, 2025