LookingGlass : Anamorphoses génératives via déformation par pyramide laplacienne
LookingGlass: Generative Anamorphoses via Laplacian Pyramid Warping
April 11, 2025
Auteurs: Pascal Chang, Sergio Sancho, Jingwei Tang, Markus Gross, Vinicius C. Azevedo
cs.AI
Résumé
L'anamorphose désigne une catégorie d'images délibérément déformées, les rendant méconnaissables lorsqu'elles sont vues directement. Leur véritable forme ne se révèle que lorsqu'elles sont observées depuis un point de vue spécifique, souvent à l'aide d'un dispositif catadioptrique tel qu'un miroir ou une lentille. Bien que la construction de ces dispositifs mathématiques remonte au XVIIe siècle, ils ne sont interprétables que depuis un angle de vue particulier et perdent leur sens lorsqu'ils sont vus normalement. Dans cet article, nous revisitons ces célèbres illusions d'optique avec une approche générative. À l'aide de modèles de flux rectifiés latents, nous proposons une méthode pour créer des images anamorphiques qui conservent une interprétation valide même lorsqu'elles sont vues directement. Pour ce faire, nous introduisons le Laplacian Pyramid Warping, une technique de déformation d'image sensible aux fréquences, essentielle pour générer des visuels de haute qualité. Notre travail étend les Visual Anagrams (arXiv:2311.17919) aux modèles d'espace latent et à une gamme plus large de transformations spatiales, permettant la création de nouvelles illusions perceptives génératives.
English
Anamorphosis refers to a category of images that are intentionally distorted,
making them unrecognizable when viewed directly. Their true form only reveals
itself when seen from a specific viewpoint, which can be through some
catadioptric device like a mirror or a lens. While the construction of these
mathematical devices can be traced back to as early as the 17th century, they
are only interpretable when viewed from a specific vantage point and tend to
lose meaning when seen normally. In this paper, we revisit these famous optical
illusions with a generative twist. With the help of latent rectified flow
models, we propose a method to create anamorphic images that still retain a
valid interpretation when viewed directly. To this end, we introduce Laplacian
Pyramid Warping, a frequency-aware image warping technique key to generating
high-quality visuals. Our work extends Visual Anagrams (arXiv:2311.17919) to
latent space models and to a wider range of spatial transforms, enabling the
creation of novel generative perceptual illusions.Summary
AI-Generated Summary