POLARIS: Mínimos Cuadrados de Proyección-Ortogonal para Inversión Robusta y Adaptativa en Modelos de Difusión
POLARIS: Projection-Orthogonal Least Squares for Robust and Adaptive Inversion in Diffusion Models
November 29, 2025
Autores: Wenshuo Chen, Haosen Li, Shaofeng Liang, Lei Wang, Haozhe Jia, Kaishen Yuan, Jieming Wu, Bowen Tian, Yutao Yue
cs.AI
Resumen
El paradigma de inversión-denoising, basado en modelos de difusión, sobresale en diversas tareas de edición y restauración de imágenes. Revisamos su mecanismo y revelamos un factor crítico y pasado por alto en la degradación de la reconstrucción: el error de aproximación del ruido. Este error surge de aproximar el ruido en el paso t con la predicción del paso t-1, lo que resulta en una severa acumulación de errores durante todo el proceso de inversión. Introducimos Mínimos Cuadrados Ortogonales de Proyección para una Inversión Robusta y Adaptativa (POLARIS), que reformula la inversión, transformándola de un problema de compensación de errores a un problema de origen del error. En lugar de optimizar *embeddings* o códigos latentes para compensar la deriva acumulada, POLARIS trata la escala de guía ω como una variable paso a paso y deriva una fórmula matemáticamente fundamentada para minimizar el error de inversión en cada paso. Notablemente, POLARIS mejora la calidad del latente de inversión con solo una línea de código. Con un overhead de rendimiento insignificante, mitiga sustancialmente los errores de aproximación del ruido y mejora consistentemente la precisión de las tareas posteriores.
English
The Inversion-Denoising Paradigm, which is based on diffusion models, excels in diverse image editing and restoration tasks. We revisit its mechanism and reveal a critical, overlooked factor in reconstruction degradation: the approximate noise error. This error stems from approximating the noise at step t with the prediction at step t-1, resulting in severe error accumulation throughout the inversion process. We introduce Projection-Orthogonal Least Squares for Robust and Adaptive Inversion (POLARIS), which reformulates inversion from an error-compensation problem into an error-origin problem. Rather than optimizing embeddings or latent codes to offset accumulated drift, POLARIS treats the guidance scale ω as a step-wise variable and derives a mathematically grounded formula to minimize inversion error at each step. Remarkably, POLARIS improves inversion latent quality with just one line of code. With negligible performance overhead, it substantially mitigates noise approximation errors and consistently improves the accuracy of downstream tasks.