ChatPaper.aiChatPaper

RectifiedHR: Habilitar la generación eficiente de imágenes de alta resolución mediante rectificación de energía

RectifiedHR: Enable Efficient High-Resolution Image Generation via Energy Rectification

March 4, 2025
Autores: Zhen Yang, Guibao Shen, Liang Hou, Mushui Liu, Luozhou Wang, Xin Tao, Pengfei Wan, Di Zhang, Ying-Cong Chen
cs.AI

Resumen

Los modelos de difusión han logrado avances notables en diversas tareas de generación de imágenes. Sin embargo, su rendimiento disminuye notablemente al generar imágenes en resoluciones más altas que las utilizadas durante el período de entrenamiento. A pesar de la existencia de numerosos métodos para producir imágenes de alta resolución, estos adolecen de ineficiencia o se ven obstaculizados por operaciones complejas. En este artículo, proponemos RectifiedHR, una solución eficiente y sencilla para la generación de imágenes de alta resolución sin necesidad de entrenamiento adicional. Específicamente, introducimos la estrategia de refresco de ruido, que teóricamente solo requiere unas pocas líneas de código para desbloquear la capacidad de generación de alta resolución del modelo y mejorar la eficiencia. Además, observamos por primera vez el fenómeno de decaimiento de energía que puede causar borrosidad en las imágenes durante el proceso de generación de alta resolución. Para abordar este problema, proponemos una estrategia de Rectificación de Energía, donde la modificación de los hiperparámetros de la guía sin clasificador mejora efectivamente el rendimiento de la generación. Nuestro método es completamente libre de entrenamiento y cuenta con una lógica de implementación simple. A través de extensas comparaciones con numerosos métodos de referencia, nuestro RectifiedHR demuestra una superioridad en efectividad y eficiencia.
English
Diffusion models have achieved remarkable advances in various image generation tasks. However, their performance notably declines when generating images at resolutions higher than those used during the training period. Despite the existence of numerous methods for producing high-resolution images, they either suffer from inefficiency or are hindered by complex operations. In this paper, we propose RectifiedHR, an efficient and straightforward solution for training-free high-resolution image generation. Specifically, we introduce the noise refresh strategy, which theoretically only requires a few lines of code to unlock the model's high-resolution generation ability and improve efficiency. Additionally, we first observe the phenomenon of energy decay that may cause image blurriness during the high-resolution image generation process. To address this issue, we propose an Energy Rectification strategy, where modifying the hyperparameters of the classifier-free guidance effectively improves the generation performance. Our method is entirely training-free and boasts a simple implementation logic. Through extensive comparisons with numerous baseline methods, our RectifiedHR demonstrates superior effectiveness and efficiency.

Summary

AI-Generated Summary

PDF123March 5, 2025