Das Rauschen färben: Adversarial Sobolev Alignment für getreue Bild-Superauflösung

Zusammenfassung

Generative Priors in der Bild-Superauflösung (SR) beeinträchtigen oft die originalgetreue Rekonstruktion. Wir führen diese Einschränkung auf eine grundlegende spektrale Fehlausrichtung zwischen isotropen Zielsetzungen und der intrinsischen natürlichen Bildmannigfaltigkeit zurück. Während die Direkte Präferenzoptimierung einen Weg zur Ausrichtung bietet, gelingt es ihr aufgrund ihrer Abhängigkeit von spektral flachem Gauß'schen Rauschen nicht, authentische hochfrequente Details von Halluzinationen zu unterscheiden. Um diese geometrische Lücke zu schließen, schlagen wir ASASR vor, ein theoretisch fundiertes Framework, das den generativen Fluss in eine Sobolev-induzierte Riemann'sche Geometrie umformt, indem es den Rauschübergangskern explizit einfärbt, um den natürlichen spektralen Abfall nachzubilden. Um diese geometrische Ausrichtung voranzutreiben, integrieren wir einen parametrischen Gegner, der auf dem Riesz'schen Darstellungssatz basiert und gezielte negative Stichproben synthetisiert, die den Worst-Case-Sobolev-Gradienten entsprechen, um die Optimierung entlang des Tangentialraums plausibler struktureller Fehler zu lenken. Umfangreiche Evaluierungen zeigen, dass ASASR führende generative Basislinien übertrifft, insbesondere bei der Wahrung spektraler Konsistenz und struktureller Treue, und eine robuste Lösung bietet, die Artefakte wirksam reduziert.

English

Generative priors in Image Super-Resolution (SR) often compromise faithful restoration, we attribute this limitation to a fundamental spectral misalignment between isotropic objectives and the intrinsic natural image manifold. While Direct Preference Optimization offers a path to alignment, its reliance on spectrally flat Gaussian noise fails to distinguish authentic high-frequency details from hallucinations. To bridge this geometric gap, we propose ASASR, a theoretically grounded framework that recasts the generative flow into a Sobolev-induced Riemannian geometry by explicitly coloring the noise transition kernel to mirror natural spectral decay. Driving this geometric alignment, we integrate a parametric adversary grounded in the Riesz Representation Theorem, which synthesizes targeted negative samples equivalent to worst-case Sobolev gradients to direct optimization along the tangent space of plausible structural failures. Extensive evaluations demonstrate that ASASR outperforms leading generative baselines, particularly in preserving spectral consistency and structural fidelity, offering a robust solution that effectively mitigates artifacts.