HiFlow : Génération d'images haute résolution sans entraînement avec guidage aligné sur les flux
HiFlow: Training-free High-Resolution Image Generation with Flow-Aligned Guidance
April 8, 2025
Auteurs: Jiazi Bu, Pengyang Ling, Yujie Zhou, Pan Zhang, Tong Wu, Xiaoyi Dong, Yuhang Zang, Yuhang Cao, Dahua Lin, Jiaqi Wang
cs.AI
Résumé
Les modèles de diffusion/flux texte-image (T2I) ont récemment suscité un intérêt considérable grâce à leur remarquable capacité à produire des créations visuelles flexibles. Cependant, la synthèse d'images haute résolution présente des défis redoutables en raison de la rareté et de la complexité du contenu haute résolution. Pour répondre à cela, nous présentons HiFlow, un cadre agnostique aux modèles et sans nécessité d'entraînement, visant à débloquer le potentiel de résolution des modèles de flux pré-entraînés. Plus précisément, HiFlow établit un flux de référence virtuel dans l'espace haute résolution qui capture efficacement les caractéristiques des informations de flux basse résolution, offrant ainsi un guide pour la génération haute résolution à travers trois aspects clés : l'alignement d'initialisation pour la cohérence des basses fréquences, l'alignement de direction pour la préservation de la structure, et l'alignement d'accélération pour la fidélité des détails. En exploitant ce guidage aligné sur le flux, HiFlow améliore considérablement la qualité de la synthèse d'images haute résolution des modèles T2I et démontre sa polyvalence à travers leurs variantes personnalisées. Des expériences approfondies valident la supériorité de HiFlow dans l'obtention d'une qualité d'image haute résolution supérieure par rapport aux méthodes actuelles de pointe.
English
Text-to-image (T2I) diffusion/flow models have drawn considerable attention
recently due to their remarkable ability to deliver flexible visual creations.
Still, high-resolution image synthesis presents formidable challenges due to
the scarcity and complexity of high-resolution content. To this end, we present
HiFlow, a training-free and model-agnostic framework to unlock the resolution
potential of pre-trained flow models. Specifically, HiFlow establishes a
virtual reference flow within the high-resolution space that effectively
captures the characteristics of low-resolution flow information, offering
guidance for high-resolution generation through three key aspects:
initialization alignment for low-frequency consistency, direction alignment for
structure preservation, and acceleration alignment for detail fidelity. By
leveraging this flow-aligned guidance, HiFlow substantially elevates the
quality of high-resolution image synthesis of T2I models and demonstrates
versatility across their personalized variants. Extensive experiments validate
HiFlow's superiority in achieving superior high-resolution image quality over
current state-of-the-art methods.Summary
AI-Generated Summary