ChatPaper.aiChatPaper

LookingGlass : Anamorphoses génératives via déformation par pyramide laplacienne

LookingGlass: Generative Anamorphoses via Laplacian Pyramid Warping

April 11, 2025
Auteurs: Pascal Chang, Sergio Sancho, Jingwei Tang, Markus Gross, Vinicius C. Azevedo
cs.AI

Résumé

L'anamorphose désigne une catégorie d'images délibérément déformées, les rendant méconnaissables lorsqu'elles sont vues directement. Leur véritable forme ne se révèle que lorsqu'elles sont observées depuis un point de vue spécifique, souvent à l'aide d'un dispositif catadioptrique tel qu'un miroir ou une lentille. Bien que la construction de ces dispositifs mathématiques remonte au XVIIe siècle, ils ne sont interprétables que depuis un angle de vue particulier et perdent leur sens lorsqu'ils sont vus normalement. Dans cet article, nous revisitons ces célèbres illusions d'optique avec une approche générative. À l'aide de modèles de flux rectifiés latents, nous proposons une méthode pour créer des images anamorphiques qui conservent une interprétation valide même lorsqu'elles sont vues directement. Pour ce faire, nous introduisons le Laplacian Pyramid Warping, une technique de déformation d'image sensible aux fréquences, essentielle pour générer des visuels de haute qualité. Notre travail étend les Visual Anagrams (arXiv:2311.17919) aux modèles d'espace latent et à une gamme plus large de transformations spatiales, permettant la création de nouvelles illusions perceptives génératives.
English
Anamorphosis refers to a category of images that are intentionally distorted, making them unrecognizable when viewed directly. Their true form only reveals itself when seen from a specific viewpoint, which can be through some catadioptric device like a mirror or a lens. While the construction of these mathematical devices can be traced back to as early as the 17th century, they are only interpretable when viewed from a specific vantage point and tend to lose meaning when seen normally. In this paper, we revisit these famous optical illusions with a generative twist. With the help of latent rectified flow models, we propose a method to create anamorphic images that still retain a valid interpretation when viewed directly. To this end, we introduce Laplacian Pyramid Warping, a frequency-aware image warping technique key to generating high-quality visuals. Our work extends Visual Anagrams (arXiv:2311.17919) to latent space models and to a wider range of spatial transforms, enabling the creation of novel generative perceptual illusions.

Summary

AI-Generated Summary

PDF86April 22, 2025