ThemeStation: Генерация трехмерных ресурсов, учитывающих тематику, на основе небольшого числа образцов
ThemeStation: Generating Theme-Aware 3D Assets from Few Exemplars
March 22, 2024
Авторы: Zhenwei Wang, Tengfei Wang, Gerhard Hancke, Ziwei Liu, Rynson W. H. Lau
cs.AI
Аннотация
Приложения в реальном мире часто требуют большой галереи 3D-объектов, которые соответствуют определенной теме. Несмотря на значительные достижения в общем создании 3D-контента из текста или изображения, синтезирование настраиваемых 3D-объектов, соответствующих общей теме входных 3D-образцов, остается открытой и сложной проблемой. В данной работе мы представляем ThemeStation, новый подход к генерации 3D-объектов с учетом темы. ThemeStation синтезирует настраиваемые 3D-объекты на основе нескольких заданных образцов с двумя целями: 1) единство для создания 3D-объектов, тематически соответствующих заданным образцам, и 2) разнообразие для генерации 3D-объектов с высокой степенью вариаций. Для этого мы разрабатываем двухэтапную структуру, которая сначала создает концептуальное изображение, а затем проходит этап моделирования 3D с учетом справочной информации. Мы предлагаем новую потерю двойного сжатия оценки (DSD), чтобы совместно использовать априорные знания как из входных образцов, так и из синтезированного концептуального изображения. Обширные эксперименты и пользовательские исследования подтверждают, что ThemeStation превосходит предыдущие работы в создании разнообразных 3D-моделей с учетом темы высокого качества. ThemeStation также позволяет различные приложения, такие как управляемая генерация 3D-объектов.
English
Real-world applications often require a large gallery of 3D assets that share
a consistent theme. While remarkable advances have been made in general 3D
content creation from text or image, synthesizing customized 3D assets
following the shared theme of input 3D exemplars remains an open and
challenging problem. In this work, we present ThemeStation, a novel approach
for theme-aware 3D-to-3D generation. ThemeStation synthesizes customized 3D
assets based on given few exemplars with two goals: 1) unity for generating 3D
assets that thematically align with the given exemplars and 2) diversity for
generating 3D assets with a high degree of variations. To this end, we design a
two-stage framework that draws a concept image first, followed by a
reference-informed 3D modeling stage. We propose a novel dual score
distillation (DSD) loss to jointly leverage priors from both the input
exemplars and the synthesized concept image. Extensive experiments and user
studies confirm that ThemeStation surpasses prior works in producing diverse
theme-aware 3D models with impressive quality. ThemeStation also enables
various applications such as controllable 3D-to-3D generation.Summary
AI-Generated Summary