ChatPaper.aiChatPaper

SD3.5-Flash: Distilação Guiada por Distribuição de Fluxos Gerativos

SD3.5-Flash: Distribution-Guided Distillation of Generative Flows

September 25, 2025
Autores: Hmrishav Bandyopadhyay, Rahim Entezari, Jim Scott, Reshinth Adithyan, Yi-Zhe Song, Varun Jampani
cs.AI

Resumo

Apresentamos o SD3.5-Flash, uma estrutura eficiente de destilação em poucos passos que traz geração de imagens de alta qualidade para dispositivos de consumo acessíveis. Nossa abordagem destila modelos de fluxo retificado computacionalmente proibitivos por meio de um objetivo reformulado de correspondência de distribuição, especificamente adaptado para geração em poucos passos. Introduzimos duas inovações principais: "compartilhamento de timesteps" para reduzir o ruído do gradiente e "ajuste fino de timesteps divididos" para melhorar o alinhamento com o prompt. Combinadas com otimizações abrangentes do pipeline, como reestruturação do codificador de texto e quantização especializada, nosso sistema permite tanto geração rápida quanto implantação eficiente em memória em diferentes configurações de hardware. Isso democratiza o acesso em toda a gama de dispositivos, desde telefones móveis até computadores desktop. Por meio de avaliação extensa, incluindo estudos de usuários em larga escala, demonstramos que o SD3.5-Flash supera consistentemente os métodos existentes de poucos passos, tornando a IA generativa avançada verdadeiramente acessível para implantação prática.
English
We present SD3.5-Flash, an efficient few-step distillation framework that brings high-quality image generation to accessible consumer devices. Our approach distills computationally prohibitive rectified flow models through a reformulated distribution matching objective tailored specifically for few-step generation. We introduce two key innovations: "timestep sharing" to reduce gradient noise and "split-timestep fine-tuning" to improve prompt alignment. Combined with comprehensive pipeline optimizations like text encoder restructuring and specialized quantization, our system enables both rapid generation and memory-efficient deployment across different hardware configurations. This democratizes access across the full spectrum of devices, from mobile phones to desktop computers. Through extensive evaluation including large-scale user studies, we demonstrate that SD3.5-Flash consistently outperforms existing few-step methods, making advanced generative AI truly accessible for practical deployment.
PDF92September 26, 2025