ChatPaper.aiChatPaper

創造的なつながりと視覚的コンセプト表現のための空間体験

Vibe Spaces for Creatively Connecting and Expressing Visual Concepts

December 16, 2025
著者: Huzheng Yang, Katherine Xu, Andrew Lu, Michael D. Grossberg, Yutong Bai, Jianbo Shi
cs.AI

要旨

新しい視覚概念の創造には、多くの場合、異なるアイデアをそれらの最も関連性の高い共有属性、すなわち「雰囲気(vibe)」を通じて結びつけることが必要です。本論文では、画像間のこれらの共有属性を明らかにする、首尾一貫した意味のあるハイブリッドを生成する新しいタスク「Vibe Blending」を提案します。このようなブレンドを達成することは、潜在空間内で離れた概念を結ぶ非線形の経路を特定し、それに沿って移動することが困難な既存手法にとって挑戦的な課題です。我々は、CLIPなどの特徴空間において低次元の測地線を学習する階層的グラフ多様体「Vibe Space」を提案し、概念間の滑らかで意味的に一貫した遷移を可能にします。創造的品質を評価するため、人間の判断、LLMの推論、および幾何学的な経路ベースの難易度スコアを組み合わせた認知科学に着想を得た評価フレームワークを設計しました。その結果、Vibe Spaceが生成するブレンドは、既存手法と比較して、人間から一貫してより創造的で首尾一貫していると評価されることがわかりました。
English
Creating new visual concepts often requires connecting distinct ideas through their most relevant shared attributes -- their vibe. We introduce Vibe Blending, a novel task for generating coherent and meaningful hybrids that reveals these shared attributes between images. Achieving such blends is challenging for current methods, which struggle to identify and traverse nonlinear paths linking distant concepts in latent space. We propose Vibe Space, a hierarchical graph manifold that learns low-dimensional geodesics in feature spaces like CLIP, enabling smooth and semantically consistent transitions between concepts. To evaluate creative quality, we design a cognitively inspired framework combining human judgments, LLM reasoning, and a geometric path-based difficulty score. We find that Vibe Space produces blends that humans consistently rate as more creative and coherent than current methods.
PDF11December 20, 2025