SD3.5-Flash: Distributie-Gestuurde Destillatie van Generatieve Stromen
SD3.5-Flash: Distribution-Guided Distillation of Generative Flows
September 25, 2025
Auteurs: Hmrishav Bandyopadhyay, Rahim Entezari, Jim Scott, Reshinth Adithyan, Yi-Zhe Song, Varun Jampani
cs.AI
Samenvatting
We presenteren SD3.5-Flash, een efficiënt few-step distillatiekader dat hoogwaardige beeldgeneratie mogelijk maakt op toegankelijke consumentenapparaten. Onze aanpak distilleert computationeel veeleisende rectified flow-modellen via een herformuleerd distributiematchingsdoel dat specifiek is afgestemd op few-step generatie. We introduceren twee belangrijke innovaties: "timestep sharing" om ruis in de gradienten te verminderen en "split-timestep fine-tuning" om de promptafstemming te verbeteren. In combinatie met uitgebreide pipeline-optimalisaties zoals herstructurering van de tekstencoder en gespecialiseerde kwantisering, maakt ons systeem zowel snelle generatie als geheugenefficiënte implementatie mogelijk op verschillende hardwareconfiguraties. Dit democratiseert de toegang over het volledige spectrum van apparaten, van mobiele telefoons tot desktopcomputers. Door middel van uitgebreide evaluatie, inclusief grootschalige gebruikersstudies, tonen we aan dat SD3.5-Flash consistent beter presteert dan bestaande few-step methoden, waardoor geavanceerde generatieve AI echt toegankelijk wordt voor praktische implementatie.
English
We present SD3.5-Flash, an efficient few-step distillation framework that
brings high-quality image generation to accessible consumer devices. Our
approach distills computationally prohibitive rectified flow models through a
reformulated distribution matching objective tailored specifically for few-step
generation. We introduce two key innovations: "timestep sharing" to reduce
gradient noise and "split-timestep fine-tuning" to improve prompt alignment.
Combined with comprehensive pipeline optimizations like text encoder
restructuring and specialized quantization, our system enables both rapid
generation and memory-efficient deployment across different hardware
configurations. This democratizes access across the full spectrum of devices,
from mobile phones to desktop computers. Through extensive evaluation including
large-scale user studies, we demonstrate that SD3.5-Flash consistently
outperforms existing few-step methods, making advanced generative AI truly
accessible for practical deployment.