Emparejamiento de Distribuciones en Tiempo Continuo para la Destilación de Difusión en Pocos Pasos

Resumen

La destilación en pocos pasos se ha convertido en una técnica líder para acelerar los modelos de difusión, entre los cuales la Destilación por Coincidencia de Distribuciones (DMD) y la Destilación por Consistencia son dos paradigmas representativos. Mientras que los métodos de consistencia imponen la auto-consistencia a lo largo de toda la trayectoria de la PF-ODE para dirigirla hacia la variedad de datos limpios, la DMD básica se basa en una supervisión dispersa en unos pocos instantes de tiempo predefinidos. Esta formulación restringida en tiempo discreto y la naturaleza de búsqueda de modos de la divergencia KL inversa tiende a exhibir artefactos visuales y resultados excesivamente suavizados, lo que a menudo requiere módulos auxiliares complejos —como GANs o modelos de recompensa— para restaurar la fidelidad visual. En este trabajo, presentamos la Coincidencia de Distribuciones en Tiempo Continuo (CDM), migrando por primera vez el marco DMD del anclaje discreto a la optimización continua. CDM logra esto mediante dos diseños en tiempo continuo. Primero, reemplazamos el programa discreto fijo con un programa continuo dinámico de longitud aleatoria, de modo que la coincidencia de distribuciones se imponga en puntos arbitrarios a lo largo de las trayectorias de muestreo en lugar de solo en unos pocos anclajes fijos. En segundo lugar, proponemos un objetivo de alineación en tiempo continuo que realiza una coincidencia activa fuera de la trayectoria en latentes extrapolados mediante el campo de velocidad del estudiante, mejorando la generalización y preservando los detalles visuales finos. Experimentos exhaustivos en diferentes arquitecturas, incluyendo SD3-Medium y Longcat-Image, demuestran que CDM proporciona una fidelidad visual altamente competitiva para la generación de imágenes en pocos pasos sin depender de objetivos auxiliares complejos. El código está disponible en https://github.com/byliutao/cdm.

English

Step distillation has become a leading technique for accelerating diffusion models, among which Distribution Matching Distillation (DMD) and Consistency Distillation are two representative paradigms. While consistency methods enforce self-consistency along the full PF-ODE trajectory to steer it toward the clean data manifold, vanilla DMD relies on sparse supervision at a few predefined discrete timesteps. This restricted discrete-time formulation and mode-seeking nature of the reverse KL divergence tends to exhibit visual artifacts and over-smoothed outputs, often necessitating complex auxiliary modules -- such as GANs or reward models -- to restore visual fidelity. In this work, we introduce Continuous-Time Distribution Matching (CDM), migrating the DMD framework from discrete anchoring to continuous optimization for the first time. CDM achieves this through two continuous-time designs. First, we replace the fixed discrete schedule with a dynamic continuous schedule of random length, so that distribution matching is enforced at arbitrary points along sampling trajectories rather than only at a few fixed anchors. Second, we propose a continuous-time alignment objective that performs active off-trajectory matching on latents extrapolated via the student's velocity field, improving generalization and preserving fine visual details. Extensive experiments on different architectures, including SD3-Medium and Longcat-Image, demonstrate that CDM provides highly competitive visual fidelity for few-step image generation without relying on complex auxiliary objectives. Code is available at https://github.com/byliutao/cdm.

Emparejamiento de Distribuciones en Tiempo Continuo para la Destilación de Difusión en Pocos Pasos

Continuous-Time Distribution Matching for Few-Step Diffusion Distillation

Resumen

Support