LookingGlass: Генеративные анаморфозы с использованием деформации через лапласову пирамиду
LookingGlass: Generative Anamorphoses via Laplacian Pyramid Warping
April 11, 2025
Авторы: Pascal Chang, Sergio Sancho, Jingwei Tang, Markus Gross, Vinicius C. Azevedo
cs.AI
Аннотация
Анаморфоз относится к категории изображений, которые намеренно искажены, что делает их неузнаваемыми при прямом просмотре. Их истинная форма раскрывается только при наблюдении с определённой точки зрения, которая может быть достигнута с помощью катоптрических устройств, таких как зеркало или линза. Хотя создание этих математических устройств можно проследить ещё в XVII веке, они интерпретируемы только при взгляде с определённого ракурса и теряют смысл при обычном просмотре. В данной работе мы возвращаемся к этим известным оптическим иллюзиям с генеративным подходом. С помощью моделей латентного исправленного потока мы предлагаем метод создания анаморфных изображений, которые сохраняют осмысленность при прямом просмотре. Для этого мы вводим метод Лапласианской пирамидальной деформации — частотно-ориентированную технику деформации изображений, ключевую для генерации высококачественных визуалов. Наша работа расширяет концепцию "Визуальных анаграмм" (arXiv:2311.17919) на латентные пространственные модели и более широкий спектр пространственных преобразований, позволяя создавать новые генеративные перцептивные иллюзии.
English
Anamorphosis refers to a category of images that are intentionally distorted,
making them unrecognizable when viewed directly. Their true form only reveals
itself when seen from a specific viewpoint, which can be through some
catadioptric device like a mirror or a lens. While the construction of these
mathematical devices can be traced back to as early as the 17th century, they
are only interpretable when viewed from a specific vantage point and tend to
lose meaning when seen normally. In this paper, we revisit these famous optical
illusions with a generative twist. With the help of latent rectified flow
models, we propose a method to create anamorphic images that still retain a
valid interpretation when viewed directly. To this end, we introduce Laplacian
Pyramid Warping, a frequency-aware image warping technique key to generating
high-quality visuals. Our work extends Visual Anagrams (arXiv:2311.17919) to
latent space models and to a wider range of spatial transforms, enabling the
creation of novel generative perceptual illusions.Summary
AI-Generated Summary