RectifiedHR: Habilitando a Geração Eficiente de Imagens de Alta Resolução através de Retificação de Energia
RectifiedHR: Enable Efficient High-Resolution Image Generation via Energy Rectification
March 4, 2025
Autores: Zhen Yang, Guibao Shen, Liang Hou, Mushui Liu, Luozhou Wang, Xin Tao, Pengfei Wan, Di Zhang, Ying-Cong Chen
cs.AI
Resumo
Os modelos de difusão têm alcançado avanços notáveis em diversas tarefas de geração de imagens. No entanto, seu desempenho diminui significativamente ao gerar imagens em resoluções mais altas do que as utilizadas durante o período de treinamento. Apesar da existência de vários métodos para produzir imagens de alta resolução, eles sofrem com ineficiência ou são prejudicados por operações complexas. Neste artigo, propomos o RectifiedHR, uma solução eficiente e direta para a geração de imagens de alta resolução sem necessidade de treinamento. Especificamente, introduzimos a estratégia de atualização de ruído, que teoricamente requer apenas algumas linhas de código para desbloquear a capacidade de geração de alta resolução do modelo e melhorar a eficiência. Além disso, observamos pela primeira vez o fenômeno de decaimento de energia que pode causar desfoque na imagem durante o processo de geração de imagens de alta resolução. Para resolver esse problema, propomos uma estratégia de Retificação de Energia, onde a modificação dos hiperparâmetros da orientação sem classificador melhora efetivamente o desempenho da geração. Nosso método é completamente livre de treinamento e possui uma lógica de implementação simples. Por meio de extensas comparações com diversos métodos de referência, nosso RectifiedHR demonstra superioridade em eficácia e eficiência.
English
Diffusion models have achieved remarkable advances in various image
generation tasks. However, their performance notably declines when generating
images at resolutions higher than those used during the training period.
Despite the existence of numerous methods for producing high-resolution images,
they either suffer from inefficiency or are hindered by complex operations. In
this paper, we propose RectifiedHR, an efficient and straightforward solution
for training-free high-resolution image generation. Specifically, we introduce
the noise refresh strategy, which theoretically only requires a few lines of
code to unlock the model's high-resolution generation ability and improve
efficiency. Additionally, we first observe the phenomenon of energy decay that
may cause image blurriness during the high-resolution image generation process.
To address this issue, we propose an Energy Rectification strategy, where
modifying the hyperparameters of the classifier-free guidance effectively
improves the generation performance. Our method is entirely training-free and
boasts a simple implementation logic. Through extensive comparisons with
numerous baseline methods, our RectifiedHR demonstrates superior effectiveness
and efficiency.Summary
AI-Generated Summary