ChatPaper.aiChatPaper

HiFlow: Trainingsfreie Hochauflösende Bildgenerierung mit Flussausgerichteter Steuerung

HiFlow: Training-free High-Resolution Image Generation with Flow-Aligned Guidance

April 8, 2025
Autoren: Jiazi Bu, Pengyang Ling, Yujie Zhou, Pan Zhang, Tong Wu, Xiaoyi Dong, Yuhang Zang, Yuhang Cao, Dahua Lin, Jiaqi Wang
cs.AI

Zusammenfassung

Text-to-Image (T2I) Diffusions-/Flussmodelle haben in letzter Zeit aufgrund ihrer bemerkenswerten Fähigkeit, flexible visuelle Kreationen zu liefern, erhebliche Aufmerksamkeit erregt. Dennoch stellt die Synthese hochauflösender Bilder aufgrund der Knappheit und Komplexität hochauflösender Inhalte eine enorme Herausforderung dar. Zu diesem Zweck präsentieren wir HiFlow, ein trainingsfreies und modellagnostisches Framework, um das Auflösungspotenzial vortrainierter Flussmodelle freizusetzen. Konkret etabliert HiFlow einen virtuellen Referenzfluss im hochauflösenden Raum, der effektiv die Merkmale von niedrigauflösenden Flussinformationen erfasst und eine Anleitung für die hochauflösende Generierung durch drei Schlüsselaspekte bietet: Initialisierungsausrichtung für niederfrequente Konsistenz, Richtungsausrichtung für Strukturerhaltung und Beschleunigungsausrichtung für Detailtreue. Durch die Nutzung dieser flussausgerichteten Anleitung verbessert HiFlow die Qualität der hochauflösenden Bildsynthese von T2I-Modellen erheblich und zeigt Vielseitigkeit über deren personalisierte Varianten hinweg. Umfangreiche Experimente bestätigen die Überlegenheit von HiFlow bei der Erzielung überlegener hochauflösender Bildqualität gegenüber aktuellen State-of-the-Art-Methoden.
English
Text-to-image (T2I) diffusion/flow models have drawn considerable attention recently due to their remarkable ability to deliver flexible visual creations. Still, high-resolution image synthesis presents formidable challenges due to the scarcity and complexity of high-resolution content. To this end, we present HiFlow, a training-free and model-agnostic framework to unlock the resolution potential of pre-trained flow models. Specifically, HiFlow establishes a virtual reference flow within the high-resolution space that effectively captures the characteristics of low-resolution flow information, offering guidance for high-resolution generation through three key aspects: initialization alignment for low-frequency consistency, direction alignment for structure preservation, and acceleration alignment for detail fidelity. By leveraging this flow-aligned guidance, HiFlow substantially elevates the quality of high-resolution image synthesis of T2I models and demonstrates versatility across their personalized variants. Extensive experiments validate HiFlow's superiority in achieving superior high-resolution image quality over current state-of-the-art methods.

Summary

AI-Generated Summary

PDF133April 9, 2025