Prueba de Turing de Personalización Visual
Visual Personalization Turing Test
January 30, 2026
Autores: Rameen Abdal, James Burgess, Sergey Tulyakov, Kuan-Chieh Jackson Wang
cs.AI
Resumen
Presentamos la Prueba de Turing de Personalización Visual (VPTT), un nuevo paradigma para evaluar la personalización visual contextual basado en la indistinguibilidad perceptual, en lugar de la replicación de identidad. Un modelo supera la VPTT si su resultado (imagen, video, activo 3D, etc.) es indistinguible para un juez humano o un modelo de lenguaje visual (VLM) calibrado, en comparación con contenido que una persona dada podría crear o compartir de manera plausible. Para operacionalizar la VPTT, presentamos el Marco VPTT, que integra un benchmark de 10k personajes (VPTT-Bench), un generador aumentado por recuperación visual (VPRAG) y la Puntuación VPTT, una métrica basada únicamente en texto calibrada frente a juicios humanos y de VLM. Mostramos una alta correlación entre las evaluaciones humanas, de VLM y de VPTT, validando la Puntuación VPTT como un proxy perceptual confiable. Los experimentos demuestran que VPRAG logra el mejor equilibrio entre alineación y originalidad, ofreciendo una base escalable y segura para la privacidad en la IA generativa personalizada.
English
We introduce the Visual Personalization Turing Test (VPTT), a new paradigm for evaluating contextual visual personalization based on perceptual indistinguishability, rather than identity replication. A model passes the VPTT if its output (image, video, 3D asset, etc.) is indistinguishable to a human or calibrated VLM judge from content a given person might plausibly create or share. To operationalize VPTT, we present the VPTT Framework, integrating a 10k-persona benchmark (VPTT-Bench), a visual retrieval-augmented generator (VPRAG), and the VPTT Score, a text-only metric calibrated against human and VLM judgments. We show high correlation across human, VLM, and VPTT evaluations, validating the VPTT Score as a reliable perceptual proxy. Experiments demonstrate that VPRAG achieves the best alignment-originality balance, offering a scalable and privacy-safe foundation for personalized generative AI.