RectifiedHR: エネルギー整流による効率的な高解像度画像生成の実現
RectifiedHR: Enable Efficient High-Resolution Image Generation via Energy Rectification
March 4, 2025
著者: Zhen Yang, Guibao Shen, Liang Hou, Mushui Liu, Luozhou Wang, Xin Tao, Pengfei Wan, Di Zhang, Ying-Cong Chen
cs.AI
要旨
拡散モデルは、様々な画像生成タスクにおいて顕著な進歩を遂げてきました。しかし、訓練時に使用した解像度よりも高い解像度で画像を生成する場合、その性能は著しく低下します。高解像度画像を生成するための多くの手法が存在するにもかかわらず、それらは非効率であるか、複雑な操作に阻まれています。本論文では、訓練不要の高解像度画像生成のための効率的で簡潔なソリューションであるRectifiedHRを提案します。具体的には、ノイズリフレッシュ戦略を導入し、理論的にはわずか数行のコードでモデルの高解像度生成能力を解放し、効率を向上させます。さらに、高解像度画像生成プロセスにおいて画像のぼやけを引き起こす可能性のあるエネルギー減衰現象を初めて観察しました。この問題に対処するため、分類器不要ガイダンスのハイパーパラメータを修正することで生成性能を効果的に改善するエネルギー補正戦略を提案します。我々の手法は完全に訓練不要であり、実装ロジックもシンプルです。多数のベースラインメソッドとの広範な比較を通じて、RectifiedHRは優れた有効性と効率性を実証しています。
English
Diffusion models have achieved remarkable advances in various image
generation tasks. However, their performance notably declines when generating
images at resolutions higher than those used during the training period.
Despite the existence of numerous methods for producing high-resolution images,
they either suffer from inefficiency or are hindered by complex operations. In
this paper, we propose RectifiedHR, an efficient and straightforward solution
for training-free high-resolution image generation. Specifically, we introduce
the noise refresh strategy, which theoretically only requires a few lines of
code to unlock the model's high-resolution generation ability and improve
efficiency. Additionally, we first observe the phenomenon of energy decay that
may cause image blurriness during the high-resolution image generation process.
To address this issue, we propose an Energy Rectification strategy, where
modifying the hyperparameters of the classifier-free guidance effectively
improves the generation performance. Our method is entirely training-free and
boasts a simple implementation logic. Through extensive comparisons with
numerous baseline methods, our RectifiedHR demonstrates superior effectiveness
and efficiency.Summary
AI-Generated Summary