ChatPaper.aiChatPaper

SD3.5-Flash: Distillazione Guidata dalla Distribuzione di Flussi Generativi

SD3.5-Flash: Distribution-Guided Distillation of Generative Flows

September 25, 2025
Autori: Hmrishav Bandyopadhyay, Rahim Entezari, Jim Scott, Reshinth Adithyan, Yi-Zhe Song, Varun Jampani
cs.AI

Abstract

Presentiamo SD3.5-Flash, un framework efficiente di distillazione a pochi passi che porta la generazione di immagini di alta qualità su dispositivi consumer accessibili. Il nostro approccio distilla modelli di flusso rettificato computazionalmente proibitivi attraverso un obiettivo riformulato di corrispondenza delle distribuzioni, specificamente adattato per la generazione a pochi passi. Introduciamo due innovazioni chiave: la "condivisione del timestep" per ridurre il rumore del gradiente e il "fine-tuning a timestep divisi" per migliorare l'allineamento con i prompt. Combinato con ottimizzazioni complete della pipeline come la ristrutturazione del codificatore di testo e una quantizzazione specializzata, il nostro sistema consente sia una generazione rapida che un'implementazione efficiente in termini di memoria su diverse configurazioni hardware. Ciò democratizza l'accesso su tutta la gamma di dispositivi, dai telefoni cellulari ai computer desktop. Attraverso una valutazione estesa che include studi su larga scala con utenti, dimostriamo che SD3.5-Flash supera costantemente i metodi esistenti a pochi passi, rendendo l'IA generativa avanzata veramente accessibile per l'implementazione pratica.
English
We present SD3.5-Flash, an efficient few-step distillation framework that brings high-quality image generation to accessible consumer devices. Our approach distills computationally prohibitive rectified flow models through a reformulated distribution matching objective tailored specifically for few-step generation. We introduce two key innovations: "timestep sharing" to reduce gradient noise and "split-timestep fine-tuning" to improve prompt alignment. Combined with comprehensive pipeline optimizations like text encoder restructuring and specialized quantization, our system enables both rapid generation and memory-efficient deployment across different hardware configurations. This democratizes access across the full spectrum of devices, from mobile phones to desktop computers. Through extensive evaluation including large-scale user studies, we demonstrate that SD3.5-Flash consistently outperforms existing few-step methods, making advanced generative AI truly accessible for practical deployment.
PDF92September 26, 2025