POLARIS: Проекционно-ортогональный метод наименьших квадратов для робастной и адаптивной инверсии в диффузионных моделях
POLARIS: Projection-Orthogonal Least Squares for Robust and Adaptive Inversion in Diffusion Models
November 29, 2025
Авторы: Wenshuo Chen, Haosen Li, Shaofeng Liang, Lei Wang, Haozhe Jia, Kaishen Yuan, Jieming Wu, Bowen Tian, Yutao Yue
cs.AI
Аннотация
Парадигма инверсно-шумоподавления, основанная на диффузионных моделях, демонстрирует превосходные результаты в разнообразных задачах редактирования и восстановления изображений. Мы заново исследуем её механизм и выявляем ключевой, ранее упускавшийся фактор деградации реконструкции: ошибку аппроксимации шума. Эта ошибка возникает из-за приближённой оценки шума на шаге t с помощью предсказания на шаге t-1, что приводит к значительному накоплению погрешности в течение всего процесса инверсии. Мы представляем метод Projection-Orthogonal Least Squares for Robust and Adaptive Inversion (POLARIS), который переформулирует инверсию из проблемы компенсации ошибок в проблему происхождения ошибок. Вместо оптимизации эмбеддингов или латентных кодов для смещения накопленного дрейфа, POLARIS рассматривает коэффициент управления ω как пошаговую переменную и выводит математически обоснованную формулу для минимизации ошибки инверсии на каждом шаге. Примечательно, что POLARIS улучшает качество латентного пространства инверсии всего одной строкой кода. С пренебрежимо малыми вычислительными затратами метод существенно снижает ошибки аппроксимации шума и последовательно повышает точность последующих задач.
English
The Inversion-Denoising Paradigm, which is based on diffusion models, excels in diverse image editing and restoration tasks. We revisit its mechanism and reveal a critical, overlooked factor in reconstruction degradation: the approximate noise error. This error stems from approximating the noise at step t with the prediction at step t-1, resulting in severe error accumulation throughout the inversion process. We introduce Projection-Orthogonal Least Squares for Robust and Adaptive Inversion (POLARIS), which reformulates inversion from an error-compensation problem into an error-origin problem. Rather than optimizing embeddings or latent codes to offset accumulated drift, POLARIS treats the guidance scale ω as a step-wise variable and derives a mathematically grounded formula to minimize inversion error at each step. Remarkably, POLARIS improves inversion latent quality with just one line of code. With negligible performance overhead, it substantially mitigates noise approximation errors and consistently improves the accuracy of downstream tasks.