Test di Turing sulla Personalizzazione Visiva

Abstract

Introduciamo il Visual Personalization Turing Test (VPTT), un nuovo paradigma per valutare la personalizzazione visiva contestuale basato sull'indistinguibilità percettiva, piuttosto che sulla replica dell'identità. Un modello supera il VPTT se il suo output (immagine, video, risorsa 3D, ecc.) è indistinguibile, per un giudice umano o per un VLM calibrato, da contenuti che una determinata persona potrebbe plausibilmente creare o condividere. Per rendere operativo il VPTT, presentiamo il VPTT Framework, che integra un benchmark con 10.000 persona (VPTT-Bench), un generatore aumentato con retrieval visivo (VPRAG) e il VPTT Score, una metrica basata solo su testo calibrata sui giudizi umani e dei VLM. Mostriamo un'elevata correlazione tra le valutazioni umane, dei VLM e del VPTT, convalidando il VPTT Score come un affidabile proxy percettivo. Gli esperimenti dimostrano che VPRAG raggiunge il miglior bilanciamento tra fedeltà e originalità, offrendo una base scalabile e sicura per la privacy per l'IA generativa personalizzata.

English

We introduce the Visual Personalization Turing Test (VPTT), a new paradigm for evaluating contextual visual personalization based on perceptual indistinguishability, rather than identity replication. A model passes the VPTT if its output (image, video, 3D asset, etc.) is indistinguishable to a human or calibrated VLM judge from content a given person might plausibly create or share. To operationalize VPTT, we present the VPTT Framework, integrating a 10k-persona benchmark (VPTT-Bench), a visual retrieval-augmented generator (VPRAG), and the VPTT Score, a text-only metric calibrated against human and VLM judgments. We show high correlation across human, VLM, and VPTT evaluations, validating the VPTT Score as a reliable perceptual proxy. Experiments demonstrate that VPRAG achieves the best alignment-originality balance, offering a scalable and privacy-safe foundation for personalized generative AI.