ChatPaper.aiChatPaper

HPSv3: 광범위 스펙트럼 인간 선호도 점수 향상을 위한 연구

HPSv3: Towards Wide-Spectrum Human Preference Score

August 5, 2025
저자: Yuhang Ma, Xiaoshi Wu, Keqiang Sun, Hongsheng Li
cs.AI

초록

텍스트-이미지 생성 모델을 평가하는 데는 인간의 인지와의 일치가 필요하지만, 기존의 인간 중심 지표는 제한된 데이터 범위, 최적화되지 않은 특징 추출, 비효율적인 손실 함수로 인해 한계가 있습니다. 이러한 문제를 해결하기 위해 우리는 Human Preference Score v3(HPSv3)를 소개합니다. (1) 우리는 HPDv3를 공개합니다. 이는 최신 생성 모델과 저품질에서 고품질에 이르는 실제 이미지로부터 108만 개의 텍스트-이미지 쌍과 117만 개의 주석이 달린 쌍별 비교를 통합한 최초의 광범위한 인간 선호도 데이터셋입니다. (2) 우리는 불확실성 인식 순위 손실을 사용하여 미세한 순위를 위한 VLM 기반 선호도 모델을 도입했습니다. 또한, Chain-of-Human-Preference(CoHP)를 제안합니다. 이는 추가 데이터 없이도 이미지 품질을 향상시키는 반복적인 이미지 개선 방법으로, 각 단계에서 최상의 이미지를 선택하기 위해 HPSv3를 사용합니다. 광범위한 실험을 통해 HPSv3가 광범위한 이미지 평가를 위한 강력한 지표로 작용하며, CoHP가 이미지 생성 품질을 개선하는 효율적이고 인간과 일치된 접근 방식을 제공함을 입증했습니다. 코드와 데이터셋은 HPSv3 홈페이지에서 확인할 수 있습니다.
English
Evaluating text-to-image generation models requires alignment with human perception, yet existing human-centric metrics are constrained by limited data coverage, suboptimal feature extraction, and inefficient loss functions. To address these challenges, we introduce Human Preference Score v3 (HPSv3). (1) We release HPDv3, the first wide-spectrum human preference dataset integrating 1.08M text-image pairs and 1.17M annotated pairwise comparisons from state-of-the-art generative models and low to high-quality real-world images. (2) We introduce a VLM-based preference model trained using an uncertainty-aware ranking loss for fine-grained ranking. Besides, we propose Chain-of-Human-Preference (CoHP), an iterative image refinement method that enhances quality without extra data, using HPSv3 to select the best image at each step. Extensive experiments demonstrate that HPSv3 serves as a robust metric for wide-spectrum image evaluation, and CoHP offers an efficient and human-aligned approach to improve image generation quality. The code and dataset are available at the HPSv3 Homepage.
PDF132August 7, 2025