SD3.5-Flash: Verteilungsgesteuerte Destillation generativer Flüsse
SD3.5-Flash: Distribution-Guided Distillation of Generative Flows
September 25, 2025
papers.authors: Hmrishav Bandyopadhyay, Rahim Entezari, Jim Scott, Reshinth Adithyan, Yi-Zhe Song, Varun Jampani
cs.AI
papers.abstract
Wir präsentieren SD3.5-Flash, ein effizientes Few-Step-Distillationsframework, das hochwertige Bildgenerierung auf zugängliche Endgeräte bringt. Unser Ansatz destilliert rechenintensive rectified flow-Modelle durch ein reformuliertes Verteilungsanpassungsziel, das speziell für die Few-Step-Generierung entwickelt wurde. Wir führen zwei Schlüsselinnovationen ein: „Timestep Sharing“, um Gradientenrauschen zu reduzieren, und „Split-Timestep Fine-Tuning“, um die Prompt-Ausrichtung zu verbessern. In Kombination mit umfassenden Pipeline-Optimierungen wie der Umstrukturierung des Textencoders und spezialisierter Quantisierung ermöglicht unser System sowohl schnelle Generierung als auch speichereffiziente Bereitstellung über verschiedene Hardwarekonfigurationen hinweg. Dies demokratisiert den Zugang über das gesamte Spektrum der Geräte, von Mobiltelefonen bis hin zu Desktop-Computern. Durch umfangreiche Evaluierungen, einschließlich groß angelegter Nutzerstudien, zeigen wir, dass SD3.5-Flash bestehende Few-Step-Methoden durchweg übertrifft und damit fortschrittliche generative KI wirklich praktisch einsetzbar macht.
English
We present SD3.5-Flash, an efficient few-step distillation framework that
brings high-quality image generation to accessible consumer devices. Our
approach distills computationally prohibitive rectified flow models through a
reformulated distribution matching objective tailored specifically for few-step
generation. We introduce two key innovations: "timestep sharing" to reduce
gradient noise and "split-timestep fine-tuning" to improve prompt alignment.
Combined with comprehensive pipeline optimizations like text encoder
restructuring and specialized quantization, our system enables both rapid
generation and memory-efficient deployment across different hardware
configurations. This democratizes access across the full spectrum of devices,
from mobile phones to desktop computers. Through extensive evaluation including
large-scale user studies, we demonstrate that SD3.5-Flash consistently
outperforms existing few-step methods, making advanced generative AI truly
accessible for practical deployment.