SD3.5-Flash: Destilación Guiada por Distribución de Flujos Generativos
SD3.5-Flash: Distribution-Guided Distillation of Generative Flows
September 25, 2025
Autores: Hmrishav Bandyopadhyay, Rahim Entezari, Jim Scott, Reshinth Adithyan, Yi-Zhe Song, Varun Jampani
cs.AI
Resumen
Presentamos SD3.5-Flash, un marco eficiente de destilación en pocos pasos que lleva la generación de imágenes de alta calidad a dispositivos de consumo accesibles. Nuestro enfoque destila modelos de flujo rectificado computacionalmente prohibitivos mediante un objetivo reformulado de coincidencia de distribuciones diseñado específicamente para la generación en pocos pasos. Introducimos dos innovaciones clave: "compartición de pasos temporales" para reducir el ruido en los gradientes y "ajuste fino de pasos temporales divididos" para mejorar la alineación con las indicaciones. Combinado con optimizaciones integrales de la pipeline, como la reestructuración del codificador de texto y la cuantización especializada, nuestro sistema permite tanto una generación rápida como un despliegue eficiente en memoria en diferentes configuraciones de hardware. Esto democratiza el acceso en todo el espectro de dispositivos, desde teléfonos móviles hasta computadoras de escritorio. A través de una evaluación exhaustiva que incluye estudios de usuarios a gran escala, demostramos que SD3.5-Flash supera consistentemente a los métodos existentes de pocos pasos, haciendo que la IA generativa avanzada sea verdaderamente accesible para su implementación práctica.
English
We present SD3.5-Flash, an efficient few-step distillation framework that
brings high-quality image generation to accessible consumer devices. Our
approach distills computationally prohibitive rectified flow models through a
reformulated distribution matching objective tailored specifically for few-step
generation. We introduce two key innovations: "timestep sharing" to reduce
gradient noise and "split-timestep fine-tuning" to improve prompt alignment.
Combined with comprehensive pipeline optimizations like text encoder
restructuring and specialized quantization, our system enables both rapid
generation and memory-efficient deployment across different hardware
configurations. This democratizes access across the full spectrum of devices,
from mobile phones to desktop computers. Through extensive evaluation including
large-scale user studies, we demonstrate that SD3.5-Flash consistently
outperforms existing few-step methods, making advanced generative AI truly
accessible for practical deployment.