ChatPaper.aiChatPaper

Visueller Personalisierungsturingtest

Visual Personalization Turing Test

January 30, 2026
papers.authors: Rameen Abdal, James Burgess, Sergey Tulyakov, Kuan-Chieh Jackson Wang
cs.AI

papers.abstract

Wir stellen den Visuellen Personalisierungs-Turing-Test (VPTT) vor, ein neues Paradigma zur Bewertung kontextueller visueller Personalisierung, das auf perzeptiver Ununterscheidbarkeit statt auf Identitätsreplikation basiert. Ein Modell besteht den VPTT, wenn seine Ausgabe (Bild, Video, 3D-Asset etc.) für einen menschlichen oder kalibrierten VLM-Bewerter nicht von Inhalten zu unterscheiden ist, die eine gegebene Person plausibel erstellen oder teilen könnte. Um den VPTT operationalisierbar zu machen, präsentieren wir den VPTT-Rahmen, der einen 10k-Personen-Benchmark (VPTT-Bench), einen visuellen retrieval-erweiterten Generator (VPRAG) und die VPTT-Bewertung integriert – eine textbasierte Metrik, die an menschlichen und VLM-Urteilen kalibriert ist. Wir zeigen eine hohe Korrelation zwischen menschlichen, VLM- und VPTT-Bewertungen, was die VPTT-Bewertung als zuverlässige perzeptive Stellvertretergröße validiert. Experimente belegen, dass VPRAG die beste Balance zwischen Ausrichtung und Originalität erreicht und damit eine skalierbare und datenschutzsichere Grundlage für personalisierte generative KI bietet.
English
We introduce the Visual Personalization Turing Test (VPTT), a new paradigm for evaluating contextual visual personalization based on perceptual indistinguishability, rather than identity replication. A model passes the VPTT if its output (image, video, 3D asset, etc.) is indistinguishable to a human or calibrated VLM judge from content a given person might plausibly create or share. To operationalize VPTT, we present the VPTT Framework, integrating a 10k-persona benchmark (VPTT-Bench), a visual retrieval-augmented generator (VPRAG), and the VPTT Score, a text-only metric calibrated against human and VLM judgments. We show high correlation across human, VLM, and VPTT evaluations, validating the VPTT Score as a reliable perceptual proxy. Experiments demonstrate that VPRAG achieves the best alignment-originality balance, offering a scalable and privacy-safe foundation for personalized generative AI.
PDF22February 3, 2026