SD3.5-Flash: Distillazione Guidata dalla Distribuzione di Flussi Generativi
SD3.5-Flash: Distribution-Guided Distillation of Generative Flows
September 25, 2025
Autori: Hmrishav Bandyopadhyay, Rahim Entezari, Jim Scott, Reshinth Adithyan, Yi-Zhe Song, Varun Jampani
cs.AI
Abstract
Presentiamo SD3.5-Flash, un framework efficiente di distillazione a pochi passi che porta la generazione di immagini di alta qualità su dispositivi consumer accessibili. Il nostro approccio distilla modelli di flusso rettificato computazionalmente proibitivi attraverso un obiettivo riformulato di corrispondenza delle distribuzioni, specificamente adattato per la generazione a pochi passi. Introduciamo due innovazioni chiave: la "condivisione del timestep" per ridurre il rumore del gradiente e il "fine-tuning a timestep divisi" per migliorare l'allineamento con i prompt. Combinato con ottimizzazioni complete della pipeline come la ristrutturazione del codificatore di testo e una quantizzazione specializzata, il nostro sistema consente sia una generazione rapida che un'implementazione efficiente in termini di memoria su diverse configurazioni hardware. Ciò democratizza l'accesso su tutta la gamma di dispositivi, dai telefoni cellulari ai computer desktop. Attraverso una valutazione estesa che include studi su larga scala con utenti, dimostriamo che SD3.5-Flash supera costantemente i metodi esistenti a pochi passi, rendendo l'IA generativa avanzata veramente accessibile per l'implementazione pratica.
English
We present SD3.5-Flash, an efficient few-step distillation framework that
brings high-quality image generation to accessible consumer devices. Our
approach distills computationally prohibitive rectified flow models through a
reformulated distribution matching objective tailored specifically for few-step
generation. We introduce two key innovations: "timestep sharing" to reduce
gradient noise and "split-timestep fine-tuning" to improve prompt alignment.
Combined with comprehensive pipeline optimizations like text encoder
restructuring and specialized quantization, our system enables both rapid
generation and memory-efficient deployment across different hardware
configurations. This democratizes access across the full spectrum of devices,
from mobile phones to desktop computers. Through extensive evaluation including
large-scale user studies, we demonstrate that SD3.5-Flash consistently
outperforms existing few-step methods, making advanced generative AI truly
accessible for practical deployment.