ChatPaper.aiChatPaper

SD3.5-Flash: Распределение-ориентированная дистилляция генеративных потоков

SD3.5-Flash: Distribution-Guided Distillation of Generative Flows

September 25, 2025
Авторы: Hmrishav Bandyopadhyay, Rahim Entezari, Jim Scott, Reshinth Adithyan, Yi-Zhe Song, Varun Jampani
cs.AI

Аннотация

Мы представляем SD3.5-Flash, эффективную фреймворк дистилляции с малым количеством шагов, которая обеспечивает генерацию высококачественных изображений на доступных потребительских устройствах. Наш подход дистиллирует вычислительно сложные модели с исправленным потоком через переформулированную цель согласования распределений, специально адаптированную для генерации с малым количеством шагов. Мы вводим два ключевых новшества: "совместное использование временных шагов" для уменьшения шума градиента и "тонкую настройку с разделением временных шагов" для улучшения соответствия запросам. В сочетании с комплексной оптимизацией конвейера, такой как реструктуризация текстового кодировщика и специализированная квантизация, наша система обеспечивает как быструю генерацию, так и эффективное использование памяти на различных аппаратных конфигурациях. Это делает технологию доступной для всего спектра устройств, от мобильных телефонов до настольных компьютеров. Благодаря обширной оценке, включая масштабные пользовательские исследования, мы демонстрируем, что SD3.5-Flash стабильно превосходит существующие методы с малым количеством шагов, делая передовые технологии генеративного ИИ действительно доступными для практического внедрения.
English
We present SD3.5-Flash, an efficient few-step distillation framework that brings high-quality image generation to accessible consumer devices. Our approach distills computationally prohibitive rectified flow models through a reformulated distribution matching objective tailored specifically for few-step generation. We introduce two key innovations: "timestep sharing" to reduce gradient noise and "split-timestep fine-tuning" to improve prompt alignment. Combined with comprehensive pipeline optimizations like text encoder restructuring and specialized quantization, our system enables both rapid generation and memory-efficient deployment across different hardware configurations. This democratizes access across the full spectrum of devices, from mobile phones to desktop computers. Through extensive evaluation including large-scale user studies, we demonstrate that SD3.5-Flash consistently outperforms existing few-step methods, making advanced generative AI truly accessible for practical deployment.
PDF92September 26, 2025