ChatPaper.aiChatPaper

LucidDreamer: Hacia la Generación de Texto a 3D de Alta Fidelidad mediante Emparejamiento de Puntuación por Intervalos

LucidDreamer: Towards High-Fidelity Text-to-3D Generation via Interval Score Matching

November 19, 2023
Autores: Yixun Liang, Xin Yang, Jiantao Lin, Haodong Li, Xiaogang Xu, Yingcong Chen
cs.AI

Resumen

Los recientes avances en la generación de texto a 3D marcan un hito significativo en los modelos generativos, desbloqueando nuevas posibilidades para la creación de activos 3D imaginativos en diversos escenarios del mundo real. Aunque los avances recientes en la generación de texto a 3D han mostrado promesa, a menudo se quedan cortos en la representación de modelos 3D detallados y de alta calidad. Este problema es especialmente prevalente, ya que muchos métodos se basan en el Muestreo de Distilación de Puntajes (SDS, por sus siglas en inglés). Este artículo identifica una deficiencia notable en el SDS: proporciona una dirección de actualización inconsistente y de baja calidad para el modelo 3D, lo que provoca un efecto de sobresuavizado. Para abordar este problema, proponemos un enfoque novedoso llamado Emparejamiento de Puntajes por Intervalos (ISM, por sus siglas en inglés). El ISM emplea trayectorias de difusión deterministas y utiliza un emparejamiento de puntajes basado en intervalos para contrarrestar el sobresuavizado. Además, incorporamos el Splatting Gaussiano 3D en nuestra canalización de generación de texto a 3D. Experimentos exhaustivos demuestran que nuestro modelo supera ampliamente al estado del arte en calidad y eficiencia de entrenamiento.
English
The recent advancements in text-to-3D generation mark a significant milestone in generative models, unlocking new possibilities for creating imaginative 3D assets across various real-world scenarios. While recent advancements in text-to-3D generation have shown promise, they often fall short in rendering detailed and high-quality 3D models. This problem is especially prevalent as many methods base themselves on Score Distillation Sampling (SDS). This paper identifies a notable deficiency in SDS, that it brings inconsistent and low-quality updating direction for the 3D model, causing the over-smoothing effect. To address this, we propose a novel approach called Interval Score Matching (ISM). ISM employs deterministic diffusing trajectories and utilizes interval-based score matching to counteract over-smoothing. Furthermore, we incorporate 3D Gaussian Splatting into our text-to-3D generation pipeline. Extensive experiments show that our model largely outperforms the state-of-the-art in quality and training efficiency.
PDF201December 15, 2024