ChatPaper.aiChatPaper

LucidDreamer: インターバルスコアマッチングによる高忠実度テキスト-to-3D生成へのアプローチ

LucidDreamer: Towards High-Fidelity Text-to-3D Generation via Interval Score Matching

November 19, 2023
著者: Yixun Liang, Xin Yang, Jiantao Lin, Haodong Li, Xiaogang Xu, Yingcong Chen
cs.AI

要旨

テキストから3D生成における最近の進展は、生成モデルにおける重要なマイルストーンを示しており、様々な現実世界のシナリオにおける創造的な3Dアセット作成の新たな可能性を切り開いています。しかしながら、テキストから3D生成の最近の進展は有望であるものの、詳細で高品質な3Dモデルのレンダリングにおいてしばしば不十分です。この問題は、多くの手法がスコア蒸留サンプリング(SDS)に基づいていることから特に顕著です。本論文では、SDSが3Dモデルに対して一貫性のない低品質な更新方向をもたらし、過剰平滑化効果を引き起こすという重大な欠陥を指摘します。これを解決するため、我々はインターバルスコアマッチング(ISM)と呼ばれる新たなアプローチを提案します。ISMは決定論的な拡散軌道を採用し、インターバルベースのスコアマッチングを活用して過剰平滑化に対抗します。さらに、テキストから3D生成パイプラインに3Dガウシアンスプラッティングを組み込みます。大規模な実験により、我々のモデルが品質と学習効率の両面で最先端の手法を大きく上回ることを示します。
English
The recent advancements in text-to-3D generation mark a significant milestone in generative models, unlocking new possibilities for creating imaginative 3D assets across various real-world scenarios. While recent advancements in text-to-3D generation have shown promise, they often fall short in rendering detailed and high-quality 3D models. This problem is especially prevalent as many methods base themselves on Score Distillation Sampling (SDS). This paper identifies a notable deficiency in SDS, that it brings inconsistent and low-quality updating direction for the 3D model, causing the over-smoothing effect. To address this, we propose a novel approach called Interval Score Matching (ISM). ISM employs deterministic diffusing trajectories and utilizes interval-based score matching to counteract over-smoothing. Furthermore, we incorporate 3D Gaussian Splatting into our text-to-3D generation pipeline. Extensive experiments show that our model largely outperforms the state-of-the-art in quality and training efficiency.
PDF201December 15, 2024