ChatPaper.aiChatPaper

HiFlow: Training-vrije generatie van hoogresolutiebeelden met Flow-Uitgelijnde Begeleiding

HiFlow: Training-free High-Resolution Image Generation with Flow-Aligned Guidance

April 8, 2025
Auteurs: Jiazi Bu, Pengyang Ling, Yujie Zhou, Pan Zhang, Tong Wu, Xiaoyi Dong, Yuhang Zang, Yuhang Cao, Dahua Lin, Jiaqi Wang
cs.AI

Samenvatting

Text-to-image (T2I) diffusie-/stroommodellen hebben recentelijk aanzienlijke aandacht getrokken vanwege hun opmerkelijke vermogen om flexibele visuele creaties te leveren. Toch vormt de synthese van hoogwaardige afbeeldingen een aanzienlijke uitdaging vanwege de schaarste en complexiteit van hoogwaardige inhoud. Daarom presenteren wij HiFlow, een trainingsvrij en model-agnostisch raamwerk om het resolutiepotentieel van vooraf getrainde stroommodellen te ontsluiten. Specifiek creëert HiFlow een virtuele referentiestroom binnen de hoogwaardige ruimte die effectief de kenmerken van laagwaardige stroominformatie vastlegt, en biedt het begeleiding voor hoogwaardige generatie via drie belangrijke aspecten: initialisatie-uitlijning voor consistentie van lage frequentie, richtingsuitlijning voor structuurbehoud, en versnellingsuitlijning voor detailgetrouwheid. Door gebruik te maken van deze stroom-uitgelijnde begeleiding, verhoogt HiFlow aanzienlijk de kwaliteit van hoogwaardige afbeeldingssynthese van T2I-modellen en toont het veelzijdigheid in hun gepersonaliseerde varianten. Uitgebreide experimenten valideren de superioriteit van HiFlow in het bereiken van superieure hoogwaardige afbeeldingskwaliteit ten opzichte van huidige state-of-the-art methoden.
English
Text-to-image (T2I) diffusion/flow models have drawn considerable attention recently due to their remarkable ability to deliver flexible visual creations. Still, high-resolution image synthesis presents formidable challenges due to the scarcity and complexity of high-resolution content. To this end, we present HiFlow, a training-free and model-agnostic framework to unlock the resolution potential of pre-trained flow models. Specifically, HiFlow establishes a virtual reference flow within the high-resolution space that effectively captures the characteristics of low-resolution flow information, offering guidance for high-resolution generation through three key aspects: initialization alignment for low-frequency consistency, direction alignment for structure preservation, and acceleration alignment for detail fidelity. By leveraging this flow-aligned guidance, HiFlow substantially elevates the quality of high-resolution image synthesis of T2I models and demonstrates versatility across their personalized variants. Extensive experiments validate HiFlow's superiority in achieving superior high-resolution image quality over current state-of-the-art methods.

Summary

AI-Generated Summary

PDF133April 9, 2025