ChatPaper.aiChatPaper

SD3.5-Flash: Verteilungsgesteuerte Destillation generativer Flüsse

SD3.5-Flash: Distribution-Guided Distillation of Generative Flows

September 25, 2025
papers.authors: Hmrishav Bandyopadhyay, Rahim Entezari, Jim Scott, Reshinth Adithyan, Yi-Zhe Song, Varun Jampani
cs.AI

papers.abstract

Wir präsentieren SD3.5-Flash, ein effizientes Few-Step-Distillationsframework, das hochwertige Bildgenerierung auf zugängliche Endgeräte bringt. Unser Ansatz destilliert rechenintensive rectified flow-Modelle durch ein reformuliertes Verteilungsanpassungsziel, das speziell für die Few-Step-Generierung entwickelt wurde. Wir führen zwei Schlüsselinnovationen ein: „Timestep Sharing“, um Gradientenrauschen zu reduzieren, und „Split-Timestep Fine-Tuning“, um die Prompt-Ausrichtung zu verbessern. In Kombination mit umfassenden Pipeline-Optimierungen wie der Umstrukturierung des Textencoders und spezialisierter Quantisierung ermöglicht unser System sowohl schnelle Generierung als auch speichereffiziente Bereitstellung über verschiedene Hardwarekonfigurationen hinweg. Dies demokratisiert den Zugang über das gesamte Spektrum der Geräte, von Mobiltelefonen bis hin zu Desktop-Computern. Durch umfangreiche Evaluierungen, einschließlich groß angelegter Nutzerstudien, zeigen wir, dass SD3.5-Flash bestehende Few-Step-Methoden durchweg übertrifft und damit fortschrittliche generative KI wirklich praktisch einsetzbar macht.
English
We present SD3.5-Flash, an efficient few-step distillation framework that brings high-quality image generation to accessible consumer devices. Our approach distills computationally prohibitive rectified flow models through a reformulated distribution matching objective tailored specifically for few-step generation. We introduce two key innovations: "timestep sharing" to reduce gradient noise and "split-timestep fine-tuning" to improve prompt alignment. Combined with comprehensive pipeline optimizations like text encoder restructuring and specialized quantization, our system enables both rapid generation and memory-efficient deployment across different hardware configurations. This democratizes access across the full spectrum of devices, from mobile phones to desktop computers. Through extensive evaluation including large-scale user studies, we demonstrate that SD3.5-Flash consistently outperforms existing few-step methods, making advanced generative AI truly accessible for practical deployment.
PDF92September 26, 2025