ChatPaper.aiChatPaper

시각적 맞춤화 튜링 테스트

Visual Personalization Turing Test

January 30, 2026
저자: Rameen Abdal, James Burgess, Sergey Tulyakov, Kuan-Chieh Jackson Wang
cs.AI

초록

우리는 정체성 복제가 아닌 지각적 구분 불가능성에 기반한 맥락적 시각적 개인화 평가를 위한 새로운 패러다임인 시각적 개인화 튜링 테스트(VPTT)를 소개한다. 모델의 출력(이미지, 비디오, 3D 에셋 등)이 주어진 사람이 그럴듯하게 생성하거나 공유할 만한 콘텐츠와 인간 또는 보정된 VLM 평가자에게 구분되지 않는다면, 해당 모델은 VPTT를 통과한 것으로 간주한다. VPTT를 운영화하기 위해 1만 명의 페르소나 벤치마크(VPTT-Bench), 시각적 검색 증강 생성기(VPRAG), 그리고 인간 및 VLM 판단에 대해 보정된 텍스트 전용 지표인 VPTT 점수를 통합한 VPTT 프레임워크를 제시한다. 우리는 인간, VLM, VPTT 평가 간의 높은 상관관계를 보여주며, VPTT 점수가 신뢰할 수 있는 지각적 대리 지표임을 입증한다. 실험 결과 VPRAG가 최적의 정렬-독창성 균형을 달성하여 개인화 생성 AI를 위한 확장 가능하고 개인정보 보호가 안전한 기반을 제공함을 확인하였다.
English
We introduce the Visual Personalization Turing Test (VPTT), a new paradigm for evaluating contextual visual personalization based on perceptual indistinguishability, rather than identity replication. A model passes the VPTT if its output (image, video, 3D asset, etc.) is indistinguishable to a human or calibrated VLM judge from content a given person might plausibly create or share. To operationalize VPTT, we present the VPTT Framework, integrating a 10k-persona benchmark (VPTT-Bench), a visual retrieval-augmented generator (VPRAG), and the VPTT Score, a text-only metric calibrated against human and VLM judgments. We show high correlation across human, VLM, and VPTT evaluations, validating the VPTT Score as a reliable perceptual proxy. Experiments demonstrate that VPRAG achieves the best alignment-originality balance, offering a scalable and privacy-safe foundation for personalized generative AI.
PDF22February 3, 2026