ChatPaper.aiChatPaper

GECO: Генеративное преобразование изображения в 3D за одну секунду

GECO: Generative Image-to-3D within a SECOnd

May 30, 2024
Авторы: Chen Wang, Jiatao Gu, Xiaoxiao Long, Yuan Liu, Lingjie Liu
cs.AI

Аннотация

В последние годы наблюдается замечательный прогресс в области генерации 3D-изображений. Существующие методы, такие как методы дистилляции оценок, достигают значительных результатов, но требуют обширной оптимизации для каждой сцены, что сказывается на эффективности времени. В отличие от них, подходы на основе реконструкции приоритизируют эффективность, но жертвуют качеством из-за ограниченной обработки неопределенности. Мы представляем GECO - новый метод высококачественного генеративного моделирования 3D-изображений, работающий за секунду. Наш подход решает актуальные проблемы неопределенности и неэффективности существующих методов через двухэтапный процесс. На первом этапе мы обучаем многовидовую генеративную модель с дистилляцией оценок. Затем применяется дистилляция на втором этапе для решения проблемы несогласованности видов из многовидового предсказания. Этот двухэтапный процесс обеспечивает сбалансированный подход к генерации 3D-изображений, оптимизируя как качество, так и эффективность. Наши комплексные эксперименты демонстрируют, что GECO достигает высококачественной генерации изображений в 3D с беспрецедентным уровнем эффективности.
English
3D generation has seen remarkable progress in recent years. Existing techniques, such as score distillation methods, produce notable results but require extensive per-scene optimization, impacting time efficiency. Alternatively, reconstruction-based approaches prioritize efficiency but compromise quality due to their limited handling of uncertainty. We introduce GECO, a novel method for high-quality 3D generative modeling that operates within a second. Our approach addresses the prevalent issues of uncertainty and inefficiency in current methods through a two-stage approach. In the initial stage, we train a single-step multi-view generative model with score distillation. Then, a second-stage distillation is applied to address the challenge of view inconsistency from the multi-view prediction. This two-stage process ensures a balanced approach to 3D generation, optimizing both quality and efficiency. Our comprehensive experiments demonstrate that GECO achieves high-quality image-to-3D generation with an unprecedented level of efficiency.

Summary

AI-Generated Summary

PDF100December 12, 2024