ChatPaper.aiChatPaper

POLARIS: 拡散モデルにおけるロバストかつ適応的な逆問題解法のための射影直交最小二乗法

POLARIS: Projection-Orthogonal Least Squares for Robust and Adaptive Inversion in Diffusion Models

November 29, 2025
著者: Wenshuo Chen, Haosen Li, Shaofeng Liang, Lei Wang, Haozhe Jia, Kaishen Yuan, Jieming Wu, Bowen Tian, Yutao Yue
cs.AI

要旨

拡散モデルに基づくInversion-Denoising Paradigmは、多様な画像編集・復元タスクにおいて優れた性能を発揮する。本論文ではそのメカニズムを再検討し、再構成品質の劣化における重要な見過ごされ要因、すなわち近似ノイズ誤差を明らかにする。この誤差は、ステップtにおけるノイズをステップt-1での予測値で近似することに起因し、反転プロセス全体で深刻な誤差蓄積を引き起こす。我々は、頑健で適応的な反転のためのProjection-Orthogonal Least Squares(POLARIS)を提案する。POLARISは、反転問題を誤差補償問題から誤差起源問題へと再定式化する。埋め込みや潜在コードを最適化して蓄積されたドリフトを相殺する代わりに、POLARISはガイダンス係数ωをステップごとの変数として扱い、各ステップでの反転誤差を数学的に最小化する式を導出する。特筆すべきは、POLARISがわずか1行のコード変更で潜在表現の品質を向上させる点である。無視できる程度の性能オーバーヘッドで、ノイズ近似誤差を大幅に軽減し、下流タスクの精度を一貫して向上させる。
English
The Inversion-Denoising Paradigm, which is based on diffusion models, excels in diverse image editing and restoration tasks. We revisit its mechanism and reveal a critical, overlooked factor in reconstruction degradation: the approximate noise error. This error stems from approximating the noise at step t with the prediction at step t-1, resulting in severe error accumulation throughout the inversion process. We introduce Projection-Orthogonal Least Squares for Robust and Adaptive Inversion (POLARIS), which reformulates inversion from an error-compensation problem into an error-origin problem. Rather than optimizing embeddings or latent codes to offset accumulated drift, POLARIS treats the guidance scale ω as a step-wise variable and derives a mathematically grounded formula to minimize inversion error at each step. Remarkably, POLARIS improves inversion latent quality with just one line of code. With negligible performance overhead, it substantially mitigates noise approximation errors and consistently improves the accuracy of downstream tasks.
PDF31December 3, 2025