Espaços de Vibração para Conexão Criativa e Expressão de Conceitos Visuais
Vibe Spaces for Creatively Connecting and Expressing Visual Concepts
December 16, 2025
Autores: Huzheng Yang, Katherine Xu, Andrew Lu, Michael D. Grossberg, Yutong Bai, Jianbo Shi
cs.AI
Resumo
A criação de novos conceitos visuais frequentemente requer a conexão de ideias distintas por meio de seus atributos compartilhados mais relevantes – a sua "vibração". Apresentamos a Fusão de Vibrações (Vibe Blending), uma nova tarefa para gerar híbridos coerentes e significativos que revelam esses atributos compartilhados entre imagens. Alcançar tais fusões é um desafio para os métodos atuais, que lutam para identificar e percorrer caminhos não lineares que conectam conceitos distantes no espaço latente. Propomos o Espaço de Vibração (Vibe Space), uma variedade de grafos hierárquica que aprende geodésicas de baixa dimensão em espaços de características como o CLIP, permitindo transições suaves e semanticamente consistentes entre conceitos. Para avaliar a qualidade criativa, projetamos uma estrutura inspirada na cognição que combina julgamentos humanos, raciocínio de LLMs (Modelos de Linguagem de Grande Escala) e uma pontuação de dificuldade baseada em caminhos geométricos. Constatamos que o Espaço de Vibração produz fusões que os humanos avaliam consistentemente como mais criativas e coerentes do que os métodos atuais.
English
Creating new visual concepts often requires connecting distinct ideas through their most relevant shared attributes -- their vibe. We introduce Vibe Blending, a novel task for generating coherent and meaningful hybrids that reveals these shared attributes between images. Achieving such blends is challenging for current methods, which struggle to identify and traverse nonlinear paths linking distant concepts in latent space. We propose Vibe Space, a hierarchical graph manifold that learns low-dimensional geodesics in feature spaces like CLIP, enabling smooth and semantically consistent transitions between concepts. To evaluate creative quality, we design a cognitively inspired framework combining human judgments, LLM reasoning, and a geometric path-based difficulty score. We find that Vibe Space produces blends that humans consistently rate as more creative and coherent than current methods.