ChatPaper.aiChatPaper

RectifiedHR : Permettre une génération efficace d'images haute résolution via une rectification énergétique

RectifiedHR: Enable Efficient High-Resolution Image Generation via Energy Rectification

March 4, 2025
Auteurs: Zhen Yang, Guibao Shen, Liang Hou, Mushui Liu, Luozhou Wang, Xin Tao, Pengfei Wan, Di Zhang, Ying-Cong Chen
cs.AI

Résumé

Les modèles de diffusion ont réalisé des avancées remarquables dans diverses tâches de génération d'images. Cependant, leurs performances déclinent notablement lors de la génération d'images à des résolutions supérieures à celles utilisées pendant la période d'entraînement. Bien qu'il existe de nombreuses méthodes pour produire des images haute résolution, elles souffrent soit d'inefficacité, soit sont entravées par des opérations complexes. Dans cet article, nous proposons RectifiedHR, une solution efficace et simple pour la génération d'images haute résolution sans entraînement. Plus précisément, nous introduisons la stratégie de rafraîchissement du bruit, qui théoriquement ne nécessite que quelques lignes de code pour débloquer la capacité de génération haute résolution du modèle et améliorer l'efficacité. De plus, nous observons pour la première fois le phénomène de décroissance d'énergie qui peut provoquer un flou d'image lors du processus de génération d'images haute résolution. Pour résoudre ce problème, nous proposons une stratégie de Rectification d'Énergie, où la modification des hyperparamètres du guidage sans classificateur améliore efficacement les performances de génération. Notre méthode est entièrement exempte d'entraînement et bénéficie d'une logique d'implémentation simple. À travers des comparaisons approfondies avec de nombreuses méthodes de référence, notre RectifiedHR démontre une efficacité et une efficience supérieures.
English
Diffusion models have achieved remarkable advances in various image generation tasks. However, their performance notably declines when generating images at resolutions higher than those used during the training period. Despite the existence of numerous methods for producing high-resolution images, they either suffer from inefficiency or are hindered by complex operations. In this paper, we propose RectifiedHR, an efficient and straightforward solution for training-free high-resolution image generation. Specifically, we introduce the noise refresh strategy, which theoretically only requires a few lines of code to unlock the model's high-resolution generation ability and improve efficiency. Additionally, we first observe the phenomenon of energy decay that may cause image blurriness during the high-resolution image generation process. To address this issue, we propose an Energy Rectification strategy, where modifying the hyperparameters of the classifier-free guidance effectively improves the generation performance. Our method is entirely training-free and boasts a simple implementation logic. Through extensive comparisons with numerous baseline methods, our RectifiedHR demonstrates superior effectiveness and efficiency.

Summary

AI-Generated Summary

PDF123March 5, 2025