LookingGlass:ラプラシアンピラミッドワーピングによる生成的アナモルフォーゼス
LookingGlass: Generative Anamorphoses via Laplacian Pyramid Warping
April 11, 2025
著者: Pascal Chang, Sergio Sancho, Jingwei Tang, Markus Gross, Vinicius C. Azevedo
cs.AI
要旨
アナモルフォーシスとは、意図的に歪められた画像のカテゴリーを指し、直接見た場合には認識不能な状態となる。その真の姿は、鏡やレンズなどのカタディオプトリック装置を通して特定の視点から見たときにのみ明らかになる。これらの数学的装置の構築は17世紀まで遡ることができるが、特定の視点から見た場合にのみ解釈可能であり、通常の見方では意味を失う傾向がある。本論文では、これらの有名な錯視を生成的なアプローチで再考する。潜在空間における整流フローモデルの助けを借りて、直接見た場合にも有効な解釈を保持するアナモルフォーシス画像を作成する方法を提案する。この目的のために、高品質な視覚的生成に不可欠な周波数認識画像ワーピング技術であるラプラシアンピラミッドワーピングを導入する。我々の研究は、Visual Anagrams (arXiv:2311.17919) を潜在空間モデルおよびより広範な空間変換に拡張し、新たな生成的知覚錯視の創出を可能にする。
English
Anamorphosis refers to a category of images that are intentionally distorted,
making them unrecognizable when viewed directly. Their true form only reveals
itself when seen from a specific viewpoint, which can be through some
catadioptric device like a mirror or a lens. While the construction of these
mathematical devices can be traced back to as early as the 17th century, they
are only interpretable when viewed from a specific vantage point and tend to
lose meaning when seen normally. In this paper, we revisit these famous optical
illusions with a generative twist. With the help of latent rectified flow
models, we propose a method to create anamorphic images that still retain a
valid interpretation when viewed directly. To this end, we introduce Laplacian
Pyramid Warping, a frequency-aware image warping technique key to generating
high-quality visuals. Our work extends Visual Anagrams (arXiv:2311.17919) to
latent space models and to a wider range of spatial transforms, enabling the
creation of novel generative perceptual illusions.Summary
AI-Generated Summary