LucidDreamer: К созданию высококачественной генерации 3D-моделей из текста через сопоставление интервальных оценок
LucidDreamer: Towards High-Fidelity Text-to-3D Generation via Interval Score Matching
November 19, 2023
Авторы: Yixun Liang, Xin Yang, Jiantao Lin, Haodong Li, Xiaogang Xu, Yingcong Chen
cs.AI
Аннотация
Последние достижения в области генерации 3D-моделей из текста знаменуют собой важный этап в развитии генеративных моделей, открывая новые возможности для создания креативных 3D-ассетов в различных реальных сценариях. Однако, несмотря на прогресс, многие современные методы часто не справляются с задачей создания детализированных и высококачественных 3D-моделей. Эта проблема особенно актуальна, поскольку многие подходы основываются на методе Score Distillation Sampling (SDS). В данной работе выявлен существенный недостаток SDS: он приводит к нестабильным и низкокачественным направлениям обновления 3D-модели, вызывая эффект избыточного сглаживания. Для решения этой проблемы мы предлагаем новый подход под названием Interval Score Matching (ISM). ISM использует детерминированные траектории диффузии и интервальное сопоставление оценок для противодействия избыточному сглаживанию. Кроме того, мы интегрируем метод 3D Gaussian Splatting в наш конвейер генерации 3D-моделей из текста. Многочисленные эксперименты демонстрируют, что наша модель значительно превосходит современные аналоги по качеству и эффективности обучения.
English
The recent advancements in text-to-3D generation mark a significant milestone
in generative models, unlocking new possibilities for creating imaginative 3D
assets across various real-world scenarios. While recent advancements in
text-to-3D generation have shown promise, they often fall short in rendering
detailed and high-quality 3D models. This problem is especially prevalent as
many methods base themselves on Score Distillation Sampling (SDS). This paper
identifies a notable deficiency in SDS, that it brings inconsistent and
low-quality updating direction for the 3D model, causing the over-smoothing
effect. To address this, we propose a novel approach called Interval Score
Matching (ISM). ISM employs deterministic diffusing trajectories and utilizes
interval-based score matching to counteract over-smoothing. Furthermore, we
incorporate 3D Gaussian Splatting into our text-to-3D generation pipeline.
Extensive experiments show that our model largely outperforms the
state-of-the-art in quality and training efficiency.