ChatPaper.aiChatPaper

Differentieerbare Solver Zoektocht voor Snelle Diffusie Bemonstering

Differentiable Solver Search for Fast Diffusion Sampling

May 27, 2025
Auteurs: Shuai Wang, Zexian Li, Qipeng zhang, Tianhui Song, Xubin Li, Tiezheng Ge, Bo Zheng, Limin Wang
cs.AI

Samenvatting

Diffusiemodellen hebben een opmerkelijke generatiekwaliteit getoond, maar tegen de kosten van talrijke functie-evaluaties. Recentelijk zijn geavanceerde ODE-gebaseerde oplossers ontwikkeld om de aanzienlijke rekenkundige eisen van reverse-diffusie-oplossing bij beperkte steekproefstappen te verminderen. Deze oplossers, die sterk geïnspireerd zijn door Adams-achtige meerstapsmethoden, vertrouwen echter uitsluitend op t-gerelateerde Lagrange-interpolatie. Wij tonen aan dat t-gerelateerde Lagrange-interpolatie suboptimaal is voor diffusiemodellen en onthullen een compacte zoekruimte die bestaat uit tijdstappen en oplossercoëfficiënten. Op basis van onze analyse stellen we een nieuw differentieerbaar oplosserzoekalgoritme voor om een meer optimale oplosser te identificeren. Uitgerust met de gezochte oplosser behalen rectified-flow-modellen, zoals SiT-XL/2 en FlowDCN-XL/2, respectievelijk FID-scores van 2.40 en 2.35 op ImageNet256 met slechts 10 stappen. Tegelijkertijd bereikt het DDPM-model, DiT-XL/2, een FID-score van 2.33 met slechts 10 stappen. Opmerkelijk is dat onze gezochte oplosser traditionele oplossers met een aanzienlijke marge overtreft. Bovendien toont onze gezochte oplosser generaliseerbaarheid over verschillende modelarchitecturen, resoluties en modelgroottes.
English
Diffusion models have demonstrated remarkable generation quality but at the cost of numerous function evaluations. Recently, advanced ODE-based solvers have been developed to mitigate the substantial computational demands of reverse-diffusion solving under limited sampling steps. However, these solvers, heavily inspired by Adams-like multistep methods, rely solely on t-related Lagrange interpolation. We show that t-related Lagrange interpolation is suboptimal for diffusion model and reveal a compact search space comprised of time steps and solver coefficients. Building on our analysis, we propose a novel differentiable solver search algorithm to identify more optimal solver. Equipped with the searched solver, rectified-flow models, e.g., SiT-XL/2 and FlowDCN-XL/2, achieve FID scores of 2.40 and 2.35, respectively, on ImageNet256 with only 10 steps. Meanwhile, DDPM model, DiT-XL/2, reaches a FID score of 2.33 with only 10 steps. Notably, our searched solver outperforms traditional solvers by a significant margin. Moreover, our searched solver demonstrates generality across various model architectures, resolutions, and model sizes.
PDF122May 30, 2025