分阶一致性模型Phased Consistency Model
一致性模型(CM)最近在加速扩散模型生成方面取得了显著进展。然而,其在潜在空间中进行高分辨率、文本条件图像生成(即LCM)的应用仍然不尽人意。本文识别了LCM当前设计中的三个关键缺陷。我们调查了这些限制背后的原因,并提出了阶段一致性模型(PCM),它泛化了设计空间并解决了所有已识别的限制。我们的评估表明,在1-16步生成设置中,PCM明显优于LCM。虽然PCM专为多步细化而设计,但其在1步生成结果方面甚至优于或与先前最先进的专门设计的1步方法相媲美。此外,我们展示了PCM的方法论是多才多艺的,并且适用于视频生成,使我们能够训练最先进的少步文本到视频生成器。更多详细信息请访问https://g-u-n.github.io/projects/pcm/。