Colorer le bruit : alignement adversarial de Sobolev pour une super-résolution d'image fidèle

Résumé

Les a priori génératifs en super-résolution d'image (SR) compromettent souvent la restauration fidèle ; nous attribuons cette limitation à un désalignement spectral fondamental entre les objectifs isotropes et la variété naturelle intrinsèque des images. Alors que l'Optimisation Directe des Préférences offre une voie vers l'alignement, sa dépendance à un bruit gaussien spectralement plat ne permet pas de distinguer les détails haute fréquence authentiques des hallucinations. Pour combler cet écart géométrique, nous proposons ASASR, un cadre théoriquement fondé qui reformule le flux génératif en une géométrie riemannienne induite par Sobolev, en colorant explicitement le noyau de transition du bruit pour refléter la décroissance spectrale naturelle. Pour piloter cet alignement géométrique, nous intégrons un adversaire paramétrique fondé sur le Théorème de Représentation de Riesz, qui synthétise des échantillons négatifs ciblés équivalents aux gradients de Sobolev dans le pire cas, afin d'orienter l'optimisation le long de l'espace tangent des défaillances structurelles plausibles. Des évaluations approfondies montrent qu'ASASR surpasse les références génératives de pointe, en particulier pour préserver la cohérence spectrale et la fidélité structurelle, offrant ainsi une solution robuste qui atténue efficacement les artefacts.

English

Generative priors in Image Super-Resolution (SR) often compromise faithful restoration, we attribute this limitation to a fundamental spectral misalignment between isotropic objectives and the intrinsic natural image manifold. While Direct Preference Optimization offers a path to alignment, its reliance on spectrally flat Gaussian noise fails to distinguish authentic high-frequency details from hallucinations. To bridge this geometric gap, we propose ASASR, a theoretically grounded framework that recasts the generative flow into a Sobolev-induced Riemannian geometry by explicitly coloring the noise transition kernel to mirror natural spectral decay. Driving this geometric alignment, we integrate a parametric adversary grounded in the Riesz Representation Theorem, which synthesizes targeted negative samples equivalent to worst-case Sobolev gradients to direct optimization along the tangent space of plausible structural failures. Extensive evaluations demonstrate that ASASR outperforms leading generative baselines, particularly in preserving spectral consistency and structural fidelity, offering a robust solution that effectively mitigates artifacts.