POLARIS: Metodo dei Minimi Quadrati Proiezione-Ortogonali per l'Inversione Robusta e Adattiva nei Modelli di Diffusione
POLARIS: Projection-Orthogonal Least Squares for Robust and Adaptive Inversion in Diffusion Models
November 29, 2025
Autori: Wenshuo Chen, Haosen Li, Shaofeng Liang, Lei Wang, Haozhe Jia, Kaishen Yuan, Jieming Wu, Bowen Tian, Yutao Yue
cs.AI
Abstract
Il paradigma Inversion-Denoising, basato sui modelli di diffusione, eccelle in varie attività di editing e restauro di immagini. Rivediamo il suo meccanismo e riveliamo un fattore critico e trascurato nel degrado della ricostruzione: l'errore di approssimazione del rumore. Questo errore deriva dall'approssimazione del rumore al passo t con la predizione al passo t-1, risultando in una grave accumulazione di errore durante l'intero processo di inversione. Introduciamo Projection-Orthogonal Least Squares for Robust and Adaptive Inversion (POLARIS), che riformula l'inversione da un problema di compensazione dell'errore a un problema di origine dell'errore. Invece di ottimizzare embedding o codici latenti per compensare la deriva accumulata, POLARIS tratta il parametro di guida ω come una variabile step-wise e deriva una formula matematicamente fondata per minimizzare l'errore di inversione a ogni passo. Notevolmente, POLARIS migliora la qualità del latente di inversione con una sola riga di codice. Con un overhead prestazionale trascurabile, mitiga sostanzialmente gli errori di approssimazione del rumore e migliora costantemente l'accuratezza dei task downstream.
English
The Inversion-Denoising Paradigm, which is based on diffusion models, excels in diverse image editing and restoration tasks. We revisit its mechanism and reveal a critical, overlooked factor in reconstruction degradation: the approximate noise error. This error stems from approximating the noise at step t with the prediction at step t-1, resulting in severe error accumulation throughout the inversion process. We introduce Projection-Orthogonal Least Squares for Robust and Adaptive Inversion (POLARIS), which reformulates inversion from an error-compensation problem into an error-origin problem. Rather than optimizing embeddings or latent codes to offset accumulated drift, POLARIS treats the guidance scale ω as a step-wise variable and derives a mathematically grounded formula to minimize inversion error at each step. Remarkably, POLARIS improves inversion latent quality with just one line of code. With negligible performance overhead, it substantially mitigates noise approximation errors and consistently improves the accuracy of downstream tasks.