ChatPaper.aiChatPaper

LookingGlass: Generative Anamorphosen durch Laplacian-Pyramiden-Verzerrung

LookingGlass: Generative Anamorphoses via Laplacian Pyramid Warping

April 11, 2025
Autoren: Pascal Chang, Sergio Sancho, Jingwei Tang, Markus Gross, Vinicius C. Azevedo
cs.AI

Zusammenfassung

Anamorphose bezeichnet eine Kategorie von Bildern, die absichtlich verzerrt sind, sodass sie bei direkter Betrachtung unerkennbar erscheinen. Ihre wahre Form offenbart sich erst, wenn sie aus einem spezifischen Blickwinkel betrachtet werden, was beispielsweise durch ein katadioptrisches Gerät wie einen Spiegel oder eine Linse erfolgen kann. Obwohl die Konstruktion dieser mathematischen Geräte bis ins 17. Jahrhundert zurückverfolgt werden kann, sind sie nur aus einem bestimmten Blickwinkel interpretierbar und verlieren ihre Bedeutung bei normaler Betrachtung. In diesem Artikel beleuchten wir diese berühmten optischen Täuschungen mit einem generativen Ansatz neu. Mithilfe von latenten rectified flow-Modellen schlagen wir eine Methode vor, um anamorphe Bilder zu erzeugen, die auch bei direkter Betrachtung eine gültige Interpretation behalten. Zu diesem Zweck führen wir Laplacian Pyramid Warping ein, eine frequenzbewusste Bildverzerrungstechnik, die für die Erzeugung hochwertiger visueller Darstellungen entscheidend ist. Unsere Arbeit erweitert Visual Anagrams (arXiv:2311.17919) auf latente Raummodelle und ein breiteres Spektrum räumlicher Transformationen, wodurch die Schaffung neuartiger generativer Wahrnehmungsillusionen ermöglicht wird.
English
Anamorphosis refers to a category of images that are intentionally distorted, making them unrecognizable when viewed directly. Their true form only reveals itself when seen from a specific viewpoint, which can be through some catadioptric device like a mirror or a lens. While the construction of these mathematical devices can be traced back to as early as the 17th century, they are only interpretable when viewed from a specific vantage point and tend to lose meaning when seen normally. In this paper, we revisit these famous optical illusions with a generative twist. With the help of latent rectified flow models, we propose a method to create anamorphic images that still retain a valid interpretation when viewed directly. To this end, we introduce Laplacian Pyramid Warping, a frequency-aware image warping technique key to generating high-quality visuals. Our work extends Visual Anagrams (arXiv:2311.17919) to latent space models and to a wider range of spatial transforms, enabling the creation of novel generative perceptual illusions.
PDF86April 22, 2025