RectifiedHR: Abilitare la Generazione Efficiente di Immagini ad Alta Risoluzione tramite Rettificazione Energetica
RectifiedHR: Enable Efficient High-Resolution Image Generation via Energy Rectification
March 4, 2025
Autori: Zhen Yang, Guibao Shen, Liang Hou, Mushui Liu, Luozhou Wang, Xin Tao, Pengfei Wan, Di Zhang, Ying-Cong Chen
cs.AI
Abstract
I modelli di diffusione hanno ottenuto progressi notevoli in vari compiti di generazione di immagini. Tuttavia, le loro prestazioni diminuiscono significativamente quando si generano immagini a risoluzioni superiori a quelle utilizzate durante il periodo di addestramento. Nonostante l'esistenza di numerosi metodi per produrre immagini ad alta risoluzione, questi soffrono di inefficienza o sono ostacolati da operazioni complesse. In questo articolo, proponiamo RectifiedHR, una soluzione efficiente e semplice per la generazione di immagini ad alta risoluzione senza necessità di addestramento. Nello specifico, introduciamo la strategia di aggiornamento del rumore, che teoricamente richiede solo poche righe di codice per sbloccare la capacità di generazione ad alta risoluzione del modello e migliorare l'efficienza. Inoltre, osserviamo per la prima volta il fenomeno del decadimento energetico che può causare sfocature durante il processo di generazione di immagini ad alta risoluzione. Per affrontare questo problema, proponiamo una strategia di Rettifica Energetica, in cui la modifica degli iperparametri della guida senza classificatore migliora efficacemente le prestazioni di generazione. Il nostro metodo è completamente privo di addestramento e vanta una logica di implementazione semplice. Attraverso ampie comparazioni con numerosi metodi di base, il nostro RectifiedHR dimostra una superiorità in termini di efficacia ed efficienza.
English
Diffusion models have achieved remarkable advances in various image
generation tasks. However, their performance notably declines when generating
images at resolutions higher than those used during the training period.
Despite the existence of numerous methods for producing high-resolution images,
they either suffer from inefficiency or are hindered by complex operations. In
this paper, we propose RectifiedHR, an efficient and straightforward solution
for training-free high-resolution image generation. Specifically, we introduce
the noise refresh strategy, which theoretically only requires a few lines of
code to unlock the model's high-resolution generation ability and improve
efficiency. Additionally, we first observe the phenomenon of energy decay that
may cause image blurriness during the high-resolution image generation process.
To address this issue, we propose an Energy Rectification strategy, where
modifying the hyperparameters of the classifier-free guidance effectively
improves the generation performance. Our method is entirely training-free and
boasts a simple implementation logic. Through extensive comparisons with
numerous baseline methods, our RectifiedHR demonstrates superior effectiveness
and efficiency.Summary
AI-Generated Summary