Пространства для творческого взаимодействия и визуального самовыражения
Vibe Spaces for Creatively Connecting and Expressing Visual Concepts
December 16, 2025
Авторы: Huzheng Yang, Katherine Xu, Andrew Lu, Michael D. Grossberg, Yutong Bai, Jianbo Shi
cs.AI
Аннотация
Создание новых визуальных концепций часто требует соединения различных идей через их наиболее релевантные общие атрибуты — их "вибрацию" (vibe). Мы представляем Vibe Blending — новую задачу генерации согласованных и осмысленных гибридов, раскрывающих эти общие атрибуты между изображениями. Достижение таких смесей является сложной задачей для современных методов, которые не способны эффективно идентифицировать и перемещаться по нелинейным путям, связывающим удалённые концепции в латентном пространстве. Мы предлагаем Vibe Space — иерархическое многообразие в виде графа, которое изучает низкоразмерные геодезические в таких пространствах признаков, как CLIP, обеспечивая плавные и семантически согласованные переходы между концепциями. Для оценки творческого качества мы разрабатываем когнитивно-вдохновлённую систему, сочетающую человеческие оценки, рассуждения больших языковых моделей (LLM) и геометрическую оценку сложности на основе пути. Мы обнаружили, что Vibe Space создаёт смеси, которые люди последовательно оценивают как более креативные и согласованные по сравнению с существующими методами.
English
Creating new visual concepts often requires connecting distinct ideas through their most relevant shared attributes -- their vibe. We introduce Vibe Blending, a novel task for generating coherent and meaningful hybrids that reveals these shared attributes between images. Achieving such blends is challenging for current methods, which struggle to identify and traverse nonlinear paths linking distant concepts in latent space. We propose Vibe Space, a hierarchical graph manifold that learns low-dimensional geodesics in feature spaces like CLIP, enabling smooth and semantically consistent transitions between concepts. To evaluate creative quality, we design a cognitively inspired framework combining human judgments, LLM reasoning, and a geometric path-based difficulty score. We find that Vibe Space produces blends that humans consistently rate as more creative and coherent than current methods.