POLARIS : Moindres Carrés Orthogonaux de Projection pour l'Inversion Robuste et Adaptative dans les Modèles de Diffusion
POLARIS: Projection-Orthogonal Least Squares for Robust and Adaptive Inversion in Diffusion Models
November 29, 2025
papers.authors: Wenshuo Chen, Haosen Li, Shaofeng Liang, Lei Wang, Haozhe Jia, Kaishen Yuan, Jieming Wu, Bowen Tian, Yutao Yue
cs.AI
papers.abstract
Le paradigme Inversion-Dénuage, basé sur les modèles de diffusion, excelle dans diverses tâches d'édition et de restauration d'images. Nous revisitons son mécanisme et révélons un facteur critique et négligé dans la dégradation de la reconstruction : l'erreur de bruit approximatif. Cette erreur provient de l'approximation du bruit à l'étape t par la prédiction à l'étape t-1, entraînant une accumulation sévère d'erreurs tout au long du processus d'inversion. Nous présentons la méthode des Moindres Carrés Orthogonaux par Projection pour une Inversion Robuste et Adaptative (POLARIS), qui reformule l'inversion d'un problème de compensation d'erreur en un problème d'origine de l'erreur. Plutôt que d'optimiser des plongements ou des codes latents pour compenser la dérive accumulée, POLARIS traite le facteur de guidage ω comme une variable pas-à-pas et dérive une formule mathématiquement fondée pour minimiser l'erreur d'inversion à chaque étape. Fait remarquable, POLARIS améliore la qualité des latents d'inversion avec une seule ligne de code. Avec une surcharge de performance négligeable, elle atténue substantiellement les erreurs d'approximation du bruit et améliore constamment la précision des tâches en aval.
English
The Inversion-Denoising Paradigm, which is based on diffusion models, excels in diverse image editing and restoration tasks. We revisit its mechanism and reveal a critical, overlooked factor in reconstruction degradation: the approximate noise error. This error stems from approximating the noise at step t with the prediction at step t-1, resulting in severe error accumulation throughout the inversion process. We introduce Projection-Orthogonal Least Squares for Robust and Adaptive Inversion (POLARIS), which reformulates inversion from an error-compensation problem into an error-origin problem. Rather than optimizing embeddings or latent codes to offset accumulated drift, POLARIS treats the guidance scale ω as a step-wise variable and derives a mathematically grounded formula to minimize inversion error at each step. Remarkably, POLARIS improves inversion latent quality with just one line of code. With negligible performance overhead, it substantially mitigates noise approximation errors and consistently improves the accuracy of downstream tasks.