ChatPaper.aiChatPaper

Визуальный персонализированный тест Тьюринга

Visual Personalization Turing Test

January 30, 2026
Авторы: Rameen Abdal, James Burgess, Sergey Tulyakov, Kuan-Chieh Jackson Wang
cs.AI

Аннотация

Мы представляем Визуальный Персонализированный Тест Тьюринга (VPTT) — новую парадигму для оценки контекстной визуальной персонализации, основанную на перцептивной неразличимости, а не на воспроизведении идентичности. Модель проходит VPTT, если её результат (изображение, видео, 3D-объект и т.д.) является неотличимым для человека или калиброванного VLM-оценщика от контента, который данное лицо могло бы правдоподобно создать или опубликовать. Для практической реализации VPTT мы представляем VPTT Framework, включающий бенчмарк на 10 000 персонажей (VPTT-Bench), визуальный генератор с ретривельным усилением (VPRAG) и VPTT Score — текстовую метрику, калиброванную по отношению к суждениям человека и VLM. Мы демонстрируем высокую корреляцию между оценками человека, VLM и VPTT, что подтверждает VPTT Score в качестве надежного перцептивного прокси. Эксперименты показывают, что VPRAG достигает наилучшего баланса между соответствием и оригинальностью, предлагая масштабируемую и безопасную с точки зрения конфиденциальности основу для персонализированного генеративного ИИ.
English
We introduce the Visual Personalization Turing Test (VPTT), a new paradigm for evaluating contextual visual personalization based on perceptual indistinguishability, rather than identity replication. A model passes the VPTT if its output (image, video, 3D asset, etc.) is indistinguishable to a human or calibrated VLM judge from content a given person might plausibly create or share. To operationalize VPTT, we present the VPTT Framework, integrating a 10k-persona benchmark (VPTT-Bench), a visual retrieval-augmented generator (VPRAG), and the VPTT Score, a text-only metric calibrated against human and VLM judgments. We show high correlation across human, VLM, and VPTT evaluations, validating the VPTT Score as a reliable perceptual proxy. Experiments demonstrate that VPRAG achieves the best alignment-originality balance, offering a scalable and privacy-safe foundation for personalized generative AI.
PDF22February 3, 2026