InfiniHuman: Бесконечное создание 3D-моделей человека с точным контролем
InfiniHuman: Infinite 3D Human Creation with Precise Control
October 13, 2025
Авторы: Yuxuan Xue, Xianghui Xie, Margaret Kostyrko, Gerard Pons-Moll
cs.AI
Аннотация
Создание реалистичных и управляемых 3D-аватаров человека представляет собой давнюю задачу, особенно когда требуется охватить широкий диапазон атрибутов, таких как этническая принадлежность, возраст, стили одежды и детализированные формы тела. Сбор и аннотирование крупномасштабных наборов данных о людях для обучения генеративных моделей является чрезмерно дорогостоящим и ограниченным в масштабе и разнообразии. Основной вопрос, который мы рассматриваем в этой статье, заключается в следующем: Можно ли использовать существующие базовые модели для генерации теоретически неограниченных, богато аннотированных 3D-данных о людях? Мы представляем InfiniHuman, фреймворк, который синергетически использует эти модели для создания богато аннотированных данных о людях с минимальными затратами и теоретически неограниченной масштабируемостью. Мы предлагаем InfiniHumanData, полностью автоматизированный конвейер, который использует модели обработки изображений и текста для создания крупномасштабного мультимодального набора данных. Пользовательское исследование показывает, что наши автоматически сгенерированные идентичности неотличимы от рендеров сканированных данных. InfiniHumanData содержит 111 тысяч идентичностей, охватывающих беспрецедентное разнообразие. Каждая идентичность аннотирована многоуровневыми текстовыми описаниями, многовидовыми RGB-изображениями, детализированными изображениями одежды и параметрами формы тела SMPL. На основе этого набора данных мы предлагаем InfiniHumanGen, генеративный конвейер на основе диффузионных моделей, который учитывает текст, форму тела и элементы одежды. InfiniHumanGen позволяет быстро, реалистично и точно управляемо генерировать аватары. Многочисленные эксперименты демонстрируют значительные улучшения по сравнению с современными методами в визуальном качестве, скорости генерации и управляемости. Наш подход позволяет генерировать высококачественные аватары с детализированным управлением на практически неограниченном масштабе через практичное и доступное решение. Мы опубликуем автоматизированный конвейер генерации данных, полный набор данных InfiniHumanData и модели InfiniHumanGen по адресу https://yuxuan-xue.com/infini-human.
English
Generating realistic and controllable 3D human avatars is a long-standing
challenge, particularly when covering broad attribute ranges such as ethnicity,
age, clothing styles, and detailed body shapes. Capturing and annotating
large-scale human datasets for training generative models is prohibitively
expensive and limited in scale and diversity. The central question we address
in this paper is: Can existing foundation models be distilled to generate
theoretically unbounded, richly annotated 3D human data? We introduce
InfiniHuman, a framework that synergistically distills these models to produce
richly annotated human data at minimal cost and with theoretically unlimited
scalability. We propose InfiniHumanData, a fully automatic pipeline that
leverages vision-language and image generation models to create a large-scale
multi-modal dataset. User study shows our automatically generated identities
are undistinguishable from scan renderings. InfiniHumanData contains 111K
identities spanning unprecedented diversity. Each identity is annotated with
multi-granularity text descriptions, multi-view RGB images, detailed clothing
images, and SMPL body-shape parameters. Building on this dataset, we propose
InfiniHumanGen, a diffusion-based generative pipeline conditioned on text, body
shape, and clothing assets. InfiniHumanGen enables fast, realistic, and
precisely controllable avatar generation. Extensive experiments demonstrate
significant improvements over state-of-the-art methods in visual quality,
generation speed, and controllability. Our approach enables high-quality avatar
generation with fine-grained control at effectively unbounded scale through a
practical and affordable solution. We will publicly release the automatic data
generation pipeline, the comprehensive InfiniHumanData dataset, and the
InfiniHumanGen models at https://yuxuan-xue.com/infini-human.